Badania naukowe dotyczące Wikipedii - Academic studies about Wikipedia

Od czasu powstania Wikipedii w 2001 roku, w recenzowanych publikacjach pojawiło się wiele badań akademickich na temat internetowej encyklopedii . Badania te można podzielić na dwie kategorie. W pierwszym przeanalizowano produkcję i wiarygodność treści encyklopedii, podczas gdy w drugim zbadano aspekty społeczne, takie jak użytkowanie i administracja. Takie badania znacznie ułatwia fakt, że bazę Wikipedii można pobrać bez pomocy właściciela serwisu.

Zadowolony

Produkcja

Większość redaktorów tworzy większość trwałych treści

W przełomowym recenzowanym artykule, również wspomnianym w The Guardian , zespół sześciu badaczy z University of Minnesota zmierzył związek między liczbą edycji redaktorów a zdolnością redaktorów do przekazywania swoich pism czytelnikom Wikipedii, mierzoną pod względem wytrwałości widoki słów (PWV) — liczba wyświetleń słowa wprowadzonego przez edycję. Metodę księgowania najlepiej opisać własnymi słowami autora: „za każdym razem, gdy oglądany jest artykuł, oglądane jest również każde jego słowo. Kiedy oglądane jest słowo napisane przez redaktora X, przypisuje mu się jedno PWV”. Liczba wyświetleń artykułu została oszacowana na podstawie dzienników serwera WWW.

Naukowcy przeanalizowali 25 bilionów PWV przypisanych do zarejestrowanych użytkowników w okresie od 1 września 2002 r. do 31 października 2006 r. Pod koniec tego okresu 10% najlepszych redaktorów (według liczby edycji) otrzymało 86% PWV, górny 1% około 70%, a górny 0,1% (4200 użytkowników) to 44% PWV, czyli prawie połowa „wartości” Wikipedii, jak zmierzono w tym badaniu. 10 najlepszych redaktorów (według PWV) wniosło tylko 2,6% PWV, a tylko trzech z nich znalazło się w pierwszej 50 pod względem liczby edycji. Z danych autorzy badania wyprowadzili następującą zależność:

Wzrost udziału PWV zwiększa super wykładniczo przez Licznik rangi; innymi słowy, elitarni redaktorzy (ci, którzy redagują najwięcej razy) mają większą wartość niż [przypisuje im się] relację władzy i prawa .

W badaniu przeanalizowano również wpływ botów na treść. Pod względem liczby edycji boty dominują w Wikipedii; 9 z pierwszej dziesiątki i 20 z pierwszej 50 to boty. W przeciwieństwie do tego w rankingu PWV tylko dwa boty pojawiają się w pierwszej 50, a żaden w pierwszej 10.

Opierając się na stałym wzroście wpływu PWV na tych czołowych 0,1% redaktorów, w badaniu stwierdzono jednoznacznie:

... Częste redaktorzy dominują w tym, co ludzie widzą, gdy odwiedzają Wikipedię i ... ta dominacja rośnie.

Podział pracy i warstwy społeczne

W recenzowanym artykule odnotowano „ rozwarstwienie społeczne w społeczeństwie Wikipedii” ze względu na „klasę administratorów”. W artykule sugerowano, że taka stratyfikacja może być pod pewnymi względami korzystna, ale dostrzeżono „wyraźną późniejszą zmianę władzy między poziomami stratyfikacji” z powodu „różnic w statusie i władzy” między administratorami a innymi redaktorami.

Analizując całą historię edycji angielskiej Wikipedii do lipca 2006 r., to samo badanie wykazało, że wpływ zmian wprowadzonych przez administratorów na zawartość stale maleje od 2003 r., kiedy administratorzy wykonali około 50% wszystkich zmian, do 2006 r., kiedy to tylko 10% zmian zostały wykonane przez administratorów. Stało się tak pomimo faktu, że średnia liczba edycji na administratora wzrosła ponad pięciokrotnie w tym samym okresie. Zjawisko to zostało nazwane przez autorów artykułu „wzrostem tłumu”. Analiza, w której jako metrykę wykorzystano liczbę edytowanych słów zamiast liczby czynności edycyjnych, wykazała podobny wzorzec. Ponieważ klasa administratora jest nieco arbitralna pod względem liczby edycji, w badaniu uwzględniono również podział użytkowników na kategorie na podstawie liczby wykonanych edycji. Wyniki dla „elitarnych użytkowników”, tj. użytkowników z ponad 10 000 edycji, były nieco zgodne z tymi uzyskanymi dla administratorów, z wyjątkiem tego, że „liczba słów zmienianych przez elitarnych użytkowników nadążała za zmianami wprowadzonymi przez początkujących użytkowników, mimo że liczba edycji dokonywanych przez początkujących użytkowników wzrosła proporcjonalnie szybciej”. Do elitarnych użytkowników przypisano około 30% zmian wprowadzonych w 2006 roku. Badanie podsumowuje:

Tak więc, chociaż ich wpływ mógł osłabnąć w ostatnich latach, wydaje się, że elitarni użytkownicy nadal wnoszą znaczną część pracy wykonanej w Wikipedii. Co więcej, ... edycje dokonane przez elitarnych użytkowników wydają się mieć istotny charakter. Oznacza to, że wydają się robić więcej niż tylko poprawianie błędów ortograficznych lub ponowne formatowanie cytatów ...

Niezawodność

Artykuł z konferencji Argumentation (2010) oceniał, czy zaufanie do Wikipedii opiera się na wartościach epistemicznych czy pragmatycznych. Chociaż czytelnicy mogą nie oceniać faktycznej wiedzy i doświadczenia autorów danego artykułu, mogą ocenić pasję współtwórców do projektu i komunikatywny design, dzięki któremu ta pasja się manifestuje, i stanowić powód do zaufania.

W szczegółach autor przekonywał, że Wikipedii nie można ufać w oparciu o indywidualną wiedzę specjalistyczną, zbiorową wiedzę lub wcześniejsze doświadczenia związane z niezawodnością. Dzieje się tak, ponieważ anonimowość i pseudonimowość uniemożliwiają ocenę wiedzy, a „ kultura antyekspercka ” sprawia, że ​​jest mało prawdopodobne, aby to się zmieniło. Redagowanie Wikipedii może być w dużej mierze ograniczone do elitarnej grupy redaktorów, bez agregowania „ mądrości tłumu ”, co w niektórych przypadkach i tak obniża jakość artykułu. Osobiste doświadczenia i badania empiryczne, potwierdzone incydentami, w tym kontrowersją dotyczącą biografii Seigenthalera, skłaniają do wniosku, że Wikipedia generalnie nie jest wiarygodna. Dlatego te epistemiczne czynniki nie uzasadniają konsultacji z Wikipedią.

Autor następnie zaproponował uzasadnienie zaufania Wikipedii oparte na wartościach pragmatycznych, które z grubsza można podsumować na dwa czynniki. Po pierwsze, wielkość i aktywność wokół Wikipedii wskazuje, że redaktorzy są głęboko zaangażowani w dostarczanie światu wiedzy. Po drugie, przejrzysty rozwój polityk, praktyk, instytucji i technologii w połączeniu z rzucającymi się w oczy masowymi wysiłkami rozwiązuje możliwe obawy, jakie można mieć, ufając Wikipedii. Podnoszone obawy obejmują definicję dostarczanej wiedzy, zapobieganie zniekształconym wkładom osób, które nie podzielają tego samego zobowiązania, korygowanie uszkodzeń redakcyjnych oraz kontrolę i ulepszanie jakości artykułów.

Geografia

Badanie przeprowadzone przez Oxford Internet Institute wykazało, że w 2009 r. artykuły Wikipedii „ geotagowane ” we wszystkich wydaniach językowych obejmowały około pół miliona miejsc na Ziemi. Jednak rozkład geograficzny artykułów był bardzo nierównomierny. Większość artykułów jest pisanych o Ameryce Północnej, Europie i Azji Wschodniej, z bardzo niewielkim udziałem dużej części świata rozwijającego się, w tym większości Afryki.

Przetwarzanie języka naturalnego

Treść tekstowa i ustrukturyzowana hierarchia Wikipedii stały się ważnym źródłem wiedzy dla badaczy zajmujących się przetwarzaniem języka naturalnego i sztuczną inteligencją . W 2007 roku badacze z Technion – Israel Institute of Technology opracowali technikę zwaną Explicit Semantic Analysis, która wykorzystuje światową wiedzę zawartą w anglojęzycznych artykułach Wikipedii. Reprezentacje pojęciowe słów i tekstów są tworzone automatycznie i wykorzystywane do obliczania podobieństwa między słowami i tekstami.

Naukowcy z Ubiquitous Knowledge Processing Lab wykorzystują wiedzę językową i światową zakodowaną w Wikipedii i Wikisłowniku, aby automatycznie tworzyć bazy wiedzy językowej, które są podobne do zasobów stworzonych przez ekspertów, takich jak WordNet . Strube i Ponzetto stworzyli algorytm do identyfikowania relacji między słowami, przemierzając angielską Wikipedię za pomocą schematu kategoryzacji, i doszli do wniosku, że Wikipedia stworzyła „taksonomię zdolną do konkurowania z WordNetem w zadaniach przetwarzania językowego”.

Krytyka pól treści

Badanie przeprowadzone przez Francescę Tripodi z 2021 r. wykazało, że z około 1,5 miliona artykułów biograficznych zamieszczonych w angielskiej Wikipedii w 2021 r. tylko 19% dotyczyło kobiet. Badanie wykazało, że biografie, które istnieją, są znacznie częściej nominowane do usunięcia niż istniejące artykuły męskie.

Informacje o zdrowiu

Informacje zdrowotne w anglojęzycznej Wikipedii są powszechnie dostępne jako wyniki wyszukiwarek i strony wyników wyszukiwania , które często zawierają linki do artykułów Wikipedii. Podjęto niezależne oceny jakości informacji o zdrowiu udostępnianych w Wikipedii oraz tego, kto ma do nich dostęp. Zbadano liczbę i dane demograficzne osób poszukujących informacji o zdrowiu w Wikipedii, zakres informacji o zdrowiu w Wikipedii oraz jakość informacji w Wikipedii. Korzystanie z Wikipedii jako źródła informacji o zdrowiu ma wady.

Aspekty społeczne

Dane demograficzne

Badanie przeprowadzone przez Hitwise z 2007 roku , zamieszczone w magazynie Time , wykazało, że odwiedzający Wikipedię są prawie w równym stopniu podzieleni w proporcji 50/50 mężczyźni/kobiety, ale 60% edycji jest wprowadzanych przez redaktorów-mężczyzn.

WikiWarMonitor, który jest częścią projektu Komisji Europejskiej , wspieranego przez CORDIS FET-Open w 7PR o nazwie ICTeCollective, opublikował:

W 2011 r. w IEEE Xplore zatytułowanym „Edit wars in Wikipedia” dla IEEE Third International Conference on Social Computing (SocialCom), ogłoszono nowy sposób mierzenia, jak sporny jest artykuł Wikipedii, i zweryfikowano go z 6 wydaniami w języku indoeuropejskim, w tym w języku angielskim .

W 2012 r. w PLoS ONE, w którym wykorzystano dane skumulowane z 32-językowych edycji Wikipedii, podano, że na podstawie analizy wzorców aktywności okołodobowej udziały wkładów do angielskiej Wikipedii z Ameryki Północnej i Europy-Dalekiego Wschodu-Australii są prawie równe, podczas gdy ten wzrasta do 75% składek z Europy, Dalekiego Wschodu i Australii dla Simple English Wikipedia . Badanie obejmuje również inne analizy demograficzne innych wydań w różnych językach.

W 2013 roku w Physical Review Letters , The Letter doniósł o ogólnym modelu dynamiki społecznej w środowisku współpracy obejmującym opinie, konflikty i konsensus, z konkretnym odpowiednikiem Wikipedii: „spokojny artykuł może nagle stać się kontrowersyjny, gdy więcej osób zaangażuje się w jego redagowanie ”.

W 2014 roku opublikowano w książce rozdział zatytułowany „The Most Controversial Topics in Wikipedia: A Multilingual and Geographical Analysis”: przeanalizowano objętość edycji artykułów w różnych wersjach językowych Wikipedii w celu ustalenia najbardziej kontrowersyjnych tematów w różnych językach i grupach Języki. W wersji angielskiej trzy najbardziej kontrowersyjne artykuły to George W. Bush , Anarchism i Muhammad . Tematy w innych językach wzbudzające największe kontrowersje to Chorwacja (niemiecki), Ségolène Royal (francuski), Chile (hiszpański) i Homoseksualizm (czeski).

Zasady i wytyczne

Opisowe badanie, w którym przeanalizowano zasady i wytyczne w języku angielskim Wikipedii do września 2007 r., wykazało szereg kluczowych statystyk:

  • 44 oficjalne zasady
  • 248 wytycznych

Stwierdzono, że nawet krótka polityka, taka jak „ignoruj ​​wszystkie zasady”, wywołała wiele dyskusji i wyjaśnień:

Chociaż sama zasada „Ignoruj ​​wszystkie zasady” ma tylko szesnaście słów, strona wyjaśniająca jej znaczenie zawiera ponad 500 słów, odsyła czytelników do siedmiu innych dokumentów, wygenerowała ponad 8000 słów w dyskusji i została zmieniona ponad 100 razy w mniej niż rok.

W badaniu pobrano próbkę rozszerzenia niektórych kluczowych polityk od czasu ich powstania:

Liczba „usunięcia” została jednak uznana za niejednoznaczną, ponieważ polisa została podzielona na kilka podpolityk.

Moc gra

We wspólnym, recenzowanym badaniu przeprowadzonym w 2007 r. przez naukowców z Uniwersytetu Waszyngtońskiego i laboratoriów HP zbadano, w jaki sposób stosowane są zasady i jak współpracownicy dążą do osiągnięcia konsensusu, analizując ilościowo próbkę aktywnych stron dyskusji. Korzystając ze zrzutu bazy danych z angielskiej Wikipedii z listopada 2006 r. , badanie skupiło się na 250 stronach dyskusji w ogonie dystrybucji: 0,3% wszystkich stron dyskusji, ale zawierających 28,4% wszystkich wersji stron dyskusji i, co ważniejsze, zawierających 51,1% wszystkich linków do polityk. Z historii pobranych na próbkę stron w badaniu przeanalizowano tylko miesiące o wysokiej aktywności, zwane sekcjami krytycznymi — zestawami kolejnych miesięcy, w których zmiany zarówno artykułów, jak i stron rozmów były znaczące pod względem liczby.

W badaniu zdefiniowano i obliczono miarę rozpowszechnienia polityki. Sekcja krytyczna była uznawana za obciążoną polityką, jeśli jej czynnik polityki był co najmniej dwukrotnie wyższy od średniej. Artykuły zostały oznaczone 3 zmiennymi wskaźnikowymi :

  • kontrowersyjny
  • wyróżniony
  • obciążony polisą

Wszystkie możliwe poziomy tych trzech czynników dały 8 kategorii próbkowania. Badanie miało na celu przeanalizowanie 9 krytycznych sekcji z każdej kategorii próbkowania, ale tylko 69 krytycznych sekcji można było wybrać, ponieważ tylko 6 artykułów (historii) było jednocześnie prezentowanych, kontrowersyjnych i obciążonych polityką.

Badanie wykazało, że polityki nie były w żaden sposób konsekwentnie stosowane. Ilustrując szersze ustalenia, raport przedstawiał następujące dwa fragmenty ze stron dyskusji na Wikipedii w oczywistym kontraście:

  • dyskusja, w której uczestnicy uznali, że wyliczenie średniej z danych dostarczonych przez agencję rządową jest oryginalnym badaniem:

czy środek ... nie jest uważany za oryginalne badanie? [U3]
Nie wygląda na to, wygląda na to, że oryginalne badania zostały wykonane przez [agencję rządową], czy czegoś mi brakuje? [U4]
Jeśli [Agencja Rządowa] nie opublikowała rzeczywistej średniej, my „obliczyliśmy” to byłoby LUB, nie? Nie jestem pewny. [U3]
Nie, dlaczego miałoby być? Ekstrapolacja danych z już dostępnych informacji nie jest OR. [U5]
Z WP:NOR „artykuły nie mogą zawierać żadnej nowej analizy lub syntezy opublikowanych argumentów, koncepcji, danych, pomysłów lub stwierdzeń, które służą promowaniu stanowiska”. Za co warto... [U4]

  • dyskusja, w której dedukcja logiczna została użyta jako kontrargument dla oryginalnej polityki badawczej:

Twoje pojęcie to WP:OR. Mogę łatwo zapewnić. . . artykuł naukowy, który mówi, że antyautorytaryzm nie jest centralnym punktem paniizmu. Syntetyzujesz tutaj wszelkiego rodzaju pomysły na podstawie swojego POV. [U6]
Proste rozumowanie dedukcyjne nie jest oryginalnym badaniem. Panizm jest z natury antyautorytarny; dlatego autorytarny system gospodarczy nie może być panistą. Z czym się nie zgadzasz: przesłanką czy wnioskiem? [U7]

Twierdząc, że takie niejasności łatwo prowadzą do rozgrywek o władzę, w badaniu przy użyciu metod teorii ugruntowanej (Strauss) zidentyfikowano 7 rodzajów rozgrywek o władzę:

  • zakres artykułu (co jest nie na temat w artykule)
  • uprzedni konsensus (przeszłe decyzje przedstawiane jako bezwzględne i bezsporne)
  • moc interpretacji (podspołeczność rości sobie większy autorytet interpretacyjny niż inna)
  • zasadność kontrybutora (jego/jej ekspertyzy itp.)
  • groźba sankcji (blokowanie itp.)
  • praktyka na innych stronach (inne strony są uważane za wzorce do naśladowania)
  • legalność źródła (przytoczone odniesienie jest kwestionowane)

Ze względu na brak miejsca w opracowaniu wyszczególniono tylko pierwsze 4 rodzaje gier o władzę, które miały miejsce jedynie poprzez interpretację polityki. Przeanalizowano piątą kategorię power play; składał się z rażących naruszeń polityki, które zostały wybaczone, ponieważ ofiarodawca był ceniony za swój wkład pomimo braku poszanowania zasad.

Zakres artykułu

W badaniu uznano, że polityka Wikipedii jest niejednoznaczna w kwestiach dotyczących zakresu. Poniższa winieta służy do zilustrowania roszczenia:

... konsensus to bzdura, bo mam fakty po swojej stronie. Mam również wezwanie Wikipedii do śmiałości… usunięcie dyskusji o poglądzie Kościoła katolickiego na paleocentryzm jest nie tylko niedokładny, ale narusza WP:NPOV … . NPOV, bądź odważny... Jeśli wszyscy chcecie artykułu tylko na temat naukowej teorii paleocentryzmu, napiszcie go sami. [U12]
Napisaliśmy artykuł tylko o naukowej teorii paleocentryzmu, zanim się pojawiłaś... Oczywiście jesteś tu nowy, [U12]... kłótnia oparta na twoim czytaniu NPOV i Bądź odważny jest trochę niedorzeczna , jak dzieciak tuż po liceum, kwestionujący punkty prawa konstytucyjnego. Te rzeczy są zasadami, które mają ustalone znaczenie. Ludzie, którzy są tu od lat, rozumieją je znacznie lepiej niż ty. Nie okażą się dla ciebie skuteczną bronią w tym argumencie... [U13]
Społeczny wpływ „paleocentryzmu” nie jest „paleocentryzmem”... Wikipedia:wiki to nie papier, nie musimy wpychać wszystkiego trzeciorzędny aspekt tematu we właściwym artykule i nie musimy uważać go za niekompletny, jeśli nie ... [U14]
... pierwszą rzeczą, o której mówi łącze Wikipedia:wiki to nie papier, jest:"" Wikipedia „jest” encyklopedią”. Prawdziwa encyklopedia, taka jak Encyclopædia Britannica, zawiera fantastyczną sekcję dotyczącą paleocentryzmu, zawierającą wszystkie społeczne, polityczne i filozoficzne implikacje. [U12]
Jak omówiono w Wikipedia:wiki nie jest papierem, artykuły Wikipedii powinny zawierać krótki przegląd najważniejszych aspektów danego tematu. Dla biologa takiego jak ty centralnym aspektem paleocentryzmu z pewnością nie są jego społeczne implikacje, ale dla reszty społeczeństwa nim są. ... [U12]
... To, o czym mówisz, nie jest „paleocentryzmem”. Centralnymi zagadnieniami paleocentryzmu są równowaga okresowa, falowanie geomorficzne, napowietrzanie. Są to kwestie, które faktycznie mają związek z samym procesem paleocentryzmu. Te „aspekty społeczne”, o których mówisz, są „peryferyjne”, „nie centralne”. Są "o" paleocentryzmie, "otaczają" paleocentryzm, ale "nie są paleocentryzmem"... [U15]

Opracowanie podaje następującą interpretację gorącej debaty:

Takie walki o zakres artykułu mają miejsce nawet w środowisku hiperlinków, ponieważ tytuł artykułu ma znaczenie. Artykuł „paleocentryzm” jest bardziej prestiżowy i bardziej prawdopodobny dla czytelnika niż artykuł zatytułowany „społeczny efekt paleocentryzmu”.

Wcześniejszy konsensus

W badaniu zauważono, że w Wikipedii konsensus nigdy nie jest ostateczny, a to, co stanowi konsensus, może się w każdej chwili zmienić. Badanie wskazuje, że ta czasowa niejednoznaczność jest podatnym gruntem dla rozgrywek o władzę i umieszcza walkę pokoleń o konsensus w szerszym obrazie walki o własność artykułu:

W praktyce… często zdarzają się de facto właściciele stron lub koalicje współtwórców, które określają treść artykułu. Wcześniejszy konsensus w tej grupie może być przedstawiany jako niepodważalny, maskujący grę władzy, która mogła doprowadzić do ustanowienia konsensusu. ... Kwestią sporną jest zasadność wcześniejszego konsensusu. Długoletni współpracownicy nie chcą tracić czasu na kłótnie dotyczące kwestii, które uważają za rozwiązane. Wskazywanie na uprzedni konsensus, podobnie jak łączenie z politykami, dostarcza metody radzenia sobie z zachowaniem trollowym. Z drugiej strony nowicjusze lub osoby z marginesu często czują, że ich perspektywy nie były reprezentowane we wcześniejszych kłótniach i chcą ponownie podnieść tę kwestię.

W badaniu wykorzystano następujący fragment dyskusji, aby zilustrować tę ciągłą walkę:

Większość rzeczy, które [U17] opisuje poniżej, została już wyhaszowana. . . To jak ta gra w walnięcie w kreta: próbują pod jednym kątem, ale obalają; próbują drugiego kąta, to zostaje obalone; próbują trzeciego kąta, to zostaje obalone; a potem ponownie próbują pierwszego kąta. [U18]
Ciekawe byłoby zobaczyć, jak wielu różnych użytkowników próbuje wnieść swój wkład do tego artykułu i rozszerzyć alternatywne poglądy tylko po to, by zostać zastraszonym przez tych, którzy wierzą w [Kosmiczną Polaryzację] religijnie… dlaczego tego nie bierzesz pod uwagę być może mają rację i że [U19], [U20] i reszta z was odciągają redaktorów od tego artykułu swoim ciężkim, uprzywilejowanym administratorem POV pushem? [U21]

Moc interpretacji

Winieta ilustruje, w jaki sposób administratorzy obeszli konsensus i usunęli osobiste konta użytkowników/pacjentów cierpiących na anonimową chorobę (nazywaną w badaniu Frupizmem). Interwencja administratora miała miejsce, gdy artykuł był nominowany jako artykuł polecany.

Legalność kontrybutora

Ten rodzaj gry o władzę jest ilustrowany przez współpracownika (U24), który czerpie ze swoich wcześniejszych wkładów, aby kłócić się z innym współpracownikiem, który oskarża U24 o bycie nieproduktywnym i destrukcyjnym:

Och, masz na myśli "ja" kręci się, aby zwrócić uwagę na brak jakości na Wikipedii? Proszę, spójrz jeszcze raz na mój licznik edycji! KUPA ŚMIECHU. Mam ponad 7000 edycji... Jak wiecie, mogę przypisać sobie prawie w całości napisanie od podstaw 2 z 6 lub 7 FA w filozofii... [U24]

Wyraźna rywalizacja o własność

Badanie wykazało, że istnieją osoby, które konsekwentnie i skutecznie naruszają zasady bez sankcji:

U24 walczy o władzę kilka rażących „my albo oni”: jeśli działania U25 będą się utrzymywać, odejdzie. ... Takie działania wyraźnie naruszają zasady dotyczące własności artykułów, uprzejmości wobec innych współtwórców i traktowania nowoprzybyłych. Jako nowicjusz, U25 może nie wiedzieć o tej polityce, ale U26 z pewnością wie. Chętna ślepota [U26] wynika z faktu, że U24 jest cenionym współtwórcą artykułów filozoficznych i nie wstydzi się tego zwracać. Brakuje współtwórców, którzy chcą konsekwentnie tworzyć treści wysokiej jakości; społeczność Wikipedystyczna jest gotowa tolerować nadużycia i naruszenia zasad, jeśli wykonywana jest wartościowa praca. ...

Z całym szacunkiem, to nie dało odpowiedzi na pytanie... Chciałem wiedzieć, co było w propozycji U25, co było nie do przyjęcia. . . Jego brak referencji itp. jest oczywiście błędem, ale właśnie dlatego podałem jeden (Zapytanie, sekcja 8). [U26]
... ten punkt jest już poruszony w artykule... Może trzeba go nieco rozszerzyć. Mogę to zrobić sam, kiedy mam czas... Czy jest coś jeszcze? Czy popierasz również pogląd U25, że artykuł jest „słaby”, to znaczy musi zostać przerobiony od góry do dołu, bezsensowne bzdury, które faktycznie próbował wstawić powyżej lub inne LUB, które podał na tej stronie? Zasadniczo są dwie strony w tej sprawie, ten artykuł może zostać przejęty przez dziwaków, takich jak jego imię, czy nie? Jeśli tak, idę. Możesz mnie wspierać lub nie. Na czym stoisz?... [U24]
Nie popieram żadnym wyobrażeniem, że artykuł jest kiepski. W rzeczywistości nie zgadzam się z wieloma rzeczami, które U25 powiedział w innym miejscu na tej stronie... Naprawdę przepraszam, jeśli cię to zdenerwowało. [U26]

Uzyskanie administracji

W 2008 roku naukowcy z Carnegie Mellon University opracowali model probitowy z angielskiej Wikipedii redaktorów, którzy pomyślnie przeszły proces wzajemnej weryfikacji, aby stać się administratorzy . Używając wyłącznie metadanych Wikipedii, w tym tekstu podsumowań edycji, ich model był 74,8% dokładny w przewidywaniu zwycięskich kandydatów.

Gazeta zauważyła, że ​​pomimo protestów przeciwnych, „pod wieloma względami wybór na administratora jest awansem, odróżniającym elitarną grupę rdzeniową od dużej masy redaktorów”. W związku z tym w dokumencie wykorzystano wychwytywanie polityki — metodę, która porównuje nominalnie ważne atrybuty z tymi, które faktycznie prowadzą do awansu w środowisku pracy.

Ogólny wskaźnik powodzenia awansu spadł z 75% w 2005 r. do 53% w 2006 r. i 42% w 2007 r. Ten nagły wzrost wskaźnika niepowodzeń przypisywano wyższemu standardowi, który musieli spełnić niedawno awansowani administratorzy, i poparto anegdotą. dowody z innego niedawnego badania cytujące niektórych wczesnych administratorów, którzy wyrazili wątpliwości, czy zdaliby się na zbiórkę, gdyby ich wybory (RfA) odbyły się niedawno. W świetle tych zmian w badaniu stwierdzono, że:

Proces nazwany kiedyś przez założyciela Wikipedii „nic wielkiego” stał się dość poważną sprawą.

Wzrost/spadek prawdopodobieństwa udanej RfA na jednostkę podlegającą regresji
(liczby w nawiasach nie są statystycznie istotne przy p<0,05 )
Czynnik 2006-2007 przed 2006 r.
każda poprzednia próba RfA -14,7% -11,1%
co miesiąc od pierwszej edycji 0,4% (0,2%)
co 1000 edycji artykułu 1,8% (1,1%)
co 1000 zmian zasad Wikipedii 19,6% (0,4%)
co 1000 edycji WikiProject 17,1% (7,2%)
co 1000 edycje dyskusji w artykule 6,3% 15,4%
każda edycja Arb/mediacji/wikikiety -0,1% -0,2%
każdy wynik różnorodności (patrz tekst) 2,8% 3,7%
każdy procent wskazania „Drobna edycja” w podsumowaniach edycji 0,2% 0,2%
każdy procent pisanych przez człowieka podsumowań edycji 0,5% 0,4%
każde „dziękuję” w podsumowaniach edycji 0,3% (0,0%)
każde wskazanie „POV” w podsumowaniach edycji 0,1% (0,0%)
każda zmiana w uwagach administratora/tablicy ogłoszeń -0,1% (0,2%)

Być może, wbrew oczekiwaniom, wielokrotne „bieganie” na administratora jest szkodliwe dla szans powodzenia kandydata. Każda kolejna próba ma o 14,8% mniejszą szansę powodzenia niż poprzednia. Długość uczestnictwa w projekcie tylko w niewielkim stopniu przyczynia się do szansy powodzenia RfA.

Innym ważnym odkryciem artykułu jest to, że jedna zmiana polityki Wikipedii lub zmiana WikiProject jest warta dziesięciu zmian artykułów. Pokrewną obserwacją jest to, że kandydaci z doświadczeniem w wielu obszarach strony mieli większe szanse na wybór. Zostało to zmierzone na podstawie wyniku różnorodności , prostego zliczenia obszarów, w których uczestniczył redaktor. Artykuł podzielił Wikipedię na 16 obszarów: artykuł, przemówienie artykułu, artykuły/kategorie/szablony do usunięcia (XfD), (nie) przegląd usuwania itp. (pełna lista znajduje się w artykule). Na przykład użytkownik, który edytował artykuły, własną stronę użytkownika i opublikował jeden raz podczas przeglądu (nie)usunięcia, miałby wynik różnorodności 3. Dokonanie pojedynczej edycji w dowolnym dodatkowym regionie Wikipedii korelowało z 2,8% zwiększonym prawdopodobieństwem sukces w zdobyciu zarządu.

Dokonywanie drobnych zmian również pomogło, chociaż autorzy badania uważają, że może tak być, ponieważ drobne zmiany korelują z doświadczeniem. W przeciwieństwie do tego, każda zmiana na stronie komisji arbitrażowej lub mediacyjnej lub w powiadomieniu w Wikiquette , które są miejscem rozstrzygania sporów, zmniejsza prawdopodobieństwo sukcesu o 0,1%. Podobnie szkodliwe skutki miało wysyłanie wiadomości na tablice ogłoszeń administratorów. W badaniu zinterpretowano to jako dowód na to, że redaktorzy zaangażowani w eskalację lub przedłużanie konfliktów zmniejszają swoje szanse na zostanie administratorami.

Mówienie „dziękuję” lub jego odmiany w podsumowaniach edycji i wskazywanie problemów z punktem widzenia („POV”) (również tylko w podsumowaniach edycji, ponieważ badanie analizowało tylko metadane) przyniosło niewielką korzyść, przyczyniając się do 0,3% i 0,1% kandydata. szanse w latach 2006–2007, ale wcześniej nie osiągnęły istotności statystycznej.

Kilka czynników, które uznano za nieistotne lub w najlepszym razie marginalne:

  • Edycja stron użytkownika (w tym własnej) nie pomaga. Co zaskakujące, edycje strony dyskusji użytkownika również nie wpływają na prawdopodobieństwo administrowania.
  • Powitanie nowicjuszy lub powiedzenie „proszę” w podsumowaniach edycji nie przyniosło efektu.
  • Uczestnictwo w budowaniu konsensusu, takie jak głosowanie RfA lub pompowanie wioski, nie zwiększa prawdopodobieństwa zostania administratorem. Badanie przyznaje jednak, że udział w konsensusie był mierzony ilościowo, ale nie jakościowo.
  • Walka z wandalizmem mierzona liczbą zmian na tablicy ogłoszeń wandalizmu nie przyniosła żadnego efektu. Każdy tysiąc edycji zawierających warianty „odwrotu” był dodatnio skorelowany (7%) z administracją w latach 2006–2007, ale nie osiągnął istotności statystycznej, chyba że ktoś chciałby obniżyć próg do p<.1). Co bardziej mylące, przed 2006 r. liczba powrotów była ujemnie skorelowana (-6,8%) z sukcesem administracyjnym, przy braku osiągnięcia istotności statystycznej nawet przy p<0,1. Może to być spowodowane wprowadzeniem w 2006 r. polityki znanej jako „3RR” mającej na celu ograniczenie powrotów.

Badanie sugeruje, że niektóre z niewyjaśnionych 25% zmienności wyników mogą wynikać z czynników, które nie zostały zmierzone, takich jak jakość edycji lub udział w koordynacji poza siedzibą, takie jak (wyraźnie cytowana) tajna lista mailingowa zgłoszona w The Register . Artykuł podsumowuje:

Samo wykonanie dużej ilości pracy produkcyjnej nie wystarcza do „promocji” w Wikipedii. Redakcje artykułów kandydatów były słabymi predyktorami sukcesu. Muszą też wykazywać więcej zachowań kierowniczych. Różnorodne doświadczenie i wkład w rozwój polityk i WikiProjects były silniejszymi predyktorami sukcesu RfA. Jest to zgodne z ustaleniami, że Wikipedia to biurokracja i że praca koordynacyjna znacznie wzrosła. ... Udział w polityce Wikipedii i WikiProjects nie przewidywał administracji przed 2006 r., co sugeruje, że społeczność jako całość zaczyna przedkładać tworzenie polityki i doświadczenie organizacji nad prostą koordynację na poziomie artykułów.

Kolejne badania przeprowadzone przez inną grupę dotyczyły działań sensotwórczych poszczególnych osób podczas ich wkładu w decyzje RfA. Praca ta dowodzi, że decyzje dotyczące kandydatów RfA opierają się na wspólnej interpretacji dowodów na wiki i historii wcześniejszych interakcji.

Wikipedia w edukacji

Pomimo niechęci nauczycieli do korzystania z Wikipedii jako podstawy do pracy w klasie, okazało się, że pisanie uczniów korzystających z Wikipedii ( hebr. Wikipedia dla tego artykułu) poprawia ich zainteresowanie procesem uczenia się, ich inwestycję w wyniki pracy, ich postępy w nauce i rozwoju osobistym, a także możliwość współpracy lokalnej i międzynarodowej studentów.

Nauczanie maszynowe

Zautomatyzowana ekstrakcja wiedzy semantycznej za pomocą algorytmów uczenia maszynowego służy do „wydobycia informacji przetwarzalnych maszynowo przy stosunkowo niskich kosztach złożoności”. DBpedia wykorzystuje ustrukturyzowaną zawartość wyodrębnioną z infoboksów artykułów Wikipedii w różnych językach za pomocą algorytmów uczenia maszynowego w celu utworzenia zasobu połączonych danych w sieci semantycznej .

Wikipedia przeglądaj statystyki i ludzkie zachowania

W badaniu opublikowanym w PLoS ONE Taha Yasseri z Oxford Internet Institute i jego koledzy z Central European University wykazali, że statystyki odsłon stron artykułów o filmach są dobrze skorelowane z ich przychodami ze sprzedaży biletów. Opracowali model matematyczny do przewidywania wpływów kasowych poprzez analizę liczby odsłon, a także liczby edycji i unikalnych redaktorów stron Wikipedii dotyczących filmów. Chociaż model ten został opracowany na podstawie angielskiej Wikipedii dla filmów, metody niezależne od języka można uogólnić na inne języki i inne rodzaje produktów poza filmami.

W pracy opublikowanej w Scientific Reports w 2013 r. Helen Susannah Moat , Tobias Preis i współpracownicy wykazali związek między zmianami w liczbie wyświetleń artykułów anglojęzycznej Wikipedii dotyczących tematów finansowych a późniejszymi dużymi ruchami na giełdzie w USA.

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki

  • WikiPapers – kompilacja zasobów (artykuły konferencyjne, artykuły z czasopism, tezy, książki, zbiory danych i narzędzia) skoncentrowane na badaniu wiki i Wikipedii