Językoznawstwo internetowe - Internet linguistics

Językoznawstwo internetowe to dziedzina językoznawstwa, której orędownikiem jest angielski językoznawca David Crystal . Zajmuje się badaniem nowych stylów i form językowych, które powstały pod wpływem Internetu i innych nowych mediów , takich jak wiadomości tekstowe typu Short Message Service (SMS) . Od początku interakcji człowiek-komputer (HCI), prowadzącej do komunikacji za pośrednictwem komputera (CMC) i komunikacji za pośrednictwem Internetu (IMC), eksperci, tacy jak Gretchen McCulloch , przyznali, że lingwistyka ma w tym swój wkład, jeśli chodzi o sieć interfejs i użyteczność. Studiowanie nowego języka w Internecie może pomóc poprawić organizację pojęć, tłumaczenie i użyteczność sieci. Takie badanie ma przynieść korzyści zarówno językoznawcom, jak i internautom.

Badanie językoznawstwa internetowego może odbywać się z czterech głównych perspektyw: socjolingwistyki , edukacji , stylistyki i lingwistyki stosowanej . Dalsze wymiary rozwinęły się w wyniku dalszych postępów technologicznych – do których należy rozwój sieci jako korpusu oraz rozprzestrzenianie się i wpływ odmian stylistycznych wywołanych rozprzestrzenianiem się Internetu, poprzez środki masowego przekazu i dzieła literackie . W obliczu rosnącej liczby użytkowników podłączonych do Internetu, lingwistyczna przyszłość Internetu pozostaje do określenia, ponieważ wciąż pojawiają się nowe technologie komputerowe, a ludzie dostosowują swoje języki do tych nowych mediów. Internet nadal odgrywa znaczącą rolę zarówno w zachęcaniu ludzi, jak i w odwracaniu uwagi od używania języków.

Główne perspektywy

David Crystal zidentyfikował cztery główne perspektywy do dalszych badań – perspektywę socjolingwistyczną, perspektywę edukacyjną, perspektywę stylistyczną i perspektywę stosowaną. Cztery perspektywy są ze sobą skutecznie powiązane i wzajemnie na siebie wpływają.

Perspektywa socjolingwistyczna

Ta perspektywa dotyczy tego, jak społeczeństwo postrzega wpływ rozwoju Internetu na języki. Pojawienie się Internetu zrewolucjonizowało komunikację na wiele sposobów; zmienił sposób komunikowania się ludzi i stworzył nowe platformy o dalekosiężnym wpływie społecznym. Znaczące drogi obejmują między innymi wiadomości tekstowe SMS, e-maile , czaty , światy wirtualne i Internet.

Ewolucja tych nowych środków komunikacji wzbudziła duże zaniepokojenie w odniesieniu do sposobu, w jaki używany jest język. Według Crystala (2005) obawy te nie są ani bezpodstawne, ani niewidoczne w historii – pojawiają się one prawie zawsze, gdy nowy przełom technologiczny wpływa na języki; jak widać w XV wieku, kiedy wprowadzono druk , w XIX wieku, kiedy wynaleziono telefon, iw XX wieku, kiedy nadawanie zaczęło przenikać do naszego społeczeństwa.

Na poziomie osobistym, CMC, takie jak SMS Text Messaging i mobilna poczta e-mail ( push mail ) znacznie poprawiły natychmiastową komunikację. Niektóre przykłady obejmują iPhone'a i BlackBerry .

W szkołach często zdarza się, że nauczyciele i uczniowie otrzymują spersonalizowane szkolne konta e-mail do celów komunikacji i interakcji. Dyskusje w klasie są coraz częściej wprowadzane do Internetu w formie forów dyskusyjnych. Na przykład na Uniwersytecie Technologicznym w Nanyang studenci angażują się we wspólne uczenie się na uniwersyteckim portalu edveNTUre, gdzie biorą udział w dyskusjach na forach i quizach online oraz oglądają strumieniowe podcasty przygotowane m.in. przez instruktorów kursu. iTunes U w 2008 roku rozpoczął współpracę z uniwersytetami, przekształcając serwis muzyczny Apple w sklep, który udostępnia bezpłatnie wykłady akademickie i materiały szkolne – nawiązał współpracę z ponad 600 instytucjami w 18 krajach, w tym z uniwersytetami Oxford , Cambridge i Yale .

Te formy akademickich sieci społecznościowych i mediów mają się rozwijać, ponieważ nauczyciele z całego świata nadal poszukują nowych sposobów na lepsze zaangażowanie studentów. Studenci na Uniwersytecie Nowojorskim często wchodzą w interakcję z „gośćmi, którzy rozmawiają przez Skype'a , personelem biblioteki zapewniającym wsparcie za pośrednictwem wiadomości błyskawicznych oraz studentami uzyskującymi dostęp do zasobów bibliotecznych spoza kampusu”. Wpłynie to na sposób używania języka, ponieważ uczniowie i nauczyciele zaczną korzystać z większej liczby platform CMC.

Na poziomie zawodowym powszechne jest, że firmy mają swoje komputery i laptopy podłączone do Internetu (za pomocą przewodowego i bezprzewodowego połączenia internetowego ), a pracownicy mają indywidualne konta e-mail. To znacznie ułatwia komunikację wewnętrzną (wśród pracowników firmy) i zewnętrzną (z innymi podmiotami spoza organizacji). Komunikacja mobilna, taka jak smartfony, coraz częściej pojawia się w świecie korporacji. Na przykład w 2008 roku firma Apple ogłosiła zamiar aktywnego zintensyfikowania wysiłków, aby pomóc firmom we wprowadzaniu iPhone'a do środowiska korporacyjnego, co ułatwił rozwój technologiczny w zakresie usprawniania zintegrowanych funkcji (push e-mail, kalendarz i zarządzanie kontaktami) za pomocą ActiveSync .

Ogólnie rzecz biorąc, te nowe CMC, które są możliwe dzięki Internetowi, zmieniły sposób, w jaki ludzie używają języka – wzrasta nieformalność, a co za tym idzie, rosnący strach przed jego pogorszeniem. Jednak, jak to ujął David Crystal, należy je postrzegać pozytywnie, ponieważ odzwierciedlają siłę kreatywności języka.

Motywy

Socjolingwistykę Internetu można również badać za pomocą pięciu powiązanych ze sobą tematów.

  1. Wielojęzyczność – dotyczy rozpowszechnienia i statusu różnych języków w Internecie.
  2. Zmiana języka – z perspektywy socjolingwistycznej na zmianę języka mają wpływ fizyczne ograniczenia technologii (np. pisanie na maszynie) oraz zmieniające się priorytety społeczno-gospodarcze, takie jak globalizacja. Bada zmiany językowe na przestrzeni czasu, z naciskiem na żargon internetowy .
  3. Dyskurs konwersacyjny – Bada zmiany we wzorcach interakcji społecznych i praktyk komunikacyjnych w Internecie.
  4. Dyfuzja stylistyczna – polega na badaniu rozpowszechnienia żargonów internetowych i związanych z nimi form językowych w powszechnym użyciu. Wraz ze zmianą języka dyskurs konwersacyjny i dyfuzja stylistyczna nakładają się na aspekt stylistyki języka.
    Zobacz poniżej: Perspektywa stylistyczna
  5. Metajęzyk i lingwistyka ludowa – Polega na przyjrzeniu się, w jaki sposób te formy językowe i zmiany w Internecie są oznaczane i omawiane (np. wpływ żargonu internetowego spowodował „śmierć” apostrofu i utratę kapitalizacji).

Perspektywa edukacyjna

Edukacyjna perspektywa lingwistyki internetowej bada wpływ Internetu na formalne użycie języka , w szczególności na standardowy angielski , który z kolei wpływa na edukację językową . Wzrost i szybkie rozprzestrzenianie się korzystania z Internetu przyniosło nowe cechy językowe specyficzne tylko dla platformy internetowej. Należą do nich między innymi wzrost użycia nieformalnego języka pisanego, niespójność w stylach i stylistyce pisma oraz użycie nowych skrótów w czatach internetowych i wiadomościach SMS, gdzie ograniczenia technologiczne dotyczące liczby słów przyczyniły się do wzrostu nowych skrótów. Takie akronimy istnieją przede wszystkim ze względów praktycznych — aby skrócić czas i wysiłek wymagany do komunikowania się za pośrednictwem tych mediów, z wyjątkiem ograniczeń technologicznych. Przykłady popularnych akronimów to lol (na głośny śmiech; ogólny wyraz śmiechu), omg (o mój boże) i gtg (got to go).

Perspektywa edukacyjna została mocno ugruntowana w badaniach wpływu Internetu na edukację językową. Jest to ważny i kluczowy aspekt, ponieważ wpływa i obejmuje edukację obecnych i przyszłych pokoleń studentów we właściwym i terminowym posługiwaniu się językiem nieformalnym, który wynika z korzystania z Internetu . Istnieją obawy dotyczące rosnącej infiltracji nieformalnego używania języka i nieprawidłowego użycia słów w sytuacjach akademickich lub formalnych, takich jak używanie zwyczajnych słów, takich jak „facet” lub wybór słowa „wyklucz” zamiast „poprzedzić” w artykułach akademickich przez studentów. Jak zauważają pedagodzy, zdarzają się również problemy z pisownią i gramatyką, które występują częściej w pracach akademickich studentów, przy czym najczęściej używa się skrótów, takich jak „u” dla „ty” i „2” dla „to”.

Lingwiści i profesorowie, tacy jak Eleanor Johnson, podejrzewają, że powszechne błędy w pisaniu są silnie powiązane z korzystaniem z Internetu, gdzie nauczyciele w podobny sposób zgłaszali nowe rodzaje błędów ortograficznych i gramatycznych w pracach uczniów. Nie ma jednak dowodów naukowych potwierdzających proponowane połączenie. Naomi S. Baron (2008) argumentuje w Always On, że pisma studentów mają niewielki wpływ na korzystanie z komunikacji za pośrednictwem Internetu (IMC), takiej jak czat internetowy, wiadomości tekstowe SMS i e-mail. Badanie z 2009 roku opublikowane przez British Journal of Developmental Psychology wykazało, że uczniowie, którzy regularnie wysyłali SMS-y (wysyłali wiadomości SMS za pomocą telefonu komórkowego), prezentowali szerszy zakres słownictwa, co może mieć pozytywny wpływ na ich rozwój umiejętności czytania.

Chociaż korzystanie z Internetu zaowocowało stylistyką, która nie jest uważana za odpowiednią w akademickim i formalnym użyciu języka, korzystanie z Internetu może nie utrudniać edukacji językowej, ale raczej ją wspomagać. Internet dowiódł na różne sposoby, że może zapewnić potencjalne korzyści w usprawnianiu nauki języków, zwłaszcza w nauce drugiego lub obcego języka . Edukacja językowa przez Internet w odniesieniu do językoznawstwa internetowego jest przede wszystkim stosowana w aspekcie komunikacyjnym (korzystanie z poczty elektronicznej, forów dyskusyjnych , komunikatorów internetowych , blogów itp.). IMC pozwala na większą interakcję między uczącymi się języka a rodzimymi użytkownikami języka, zapewniając większą korekcję błędów i lepsze możliwości uczenia się języka standardowego, w procesie umożliwiającym nabycie określonych umiejętności, takich jak negocjacje i perswazja.

Perspektywa stylistyczna

Ta perspektywa bada, w jaki sposób Internet i związane z nim technologie zachęcają do nowych i różnych form kreatywności w języku, zwłaszcza w literaturze. Patrzy na Internet jako medium, za pośrednictwem którego powstały nowe zjawiska językowe. Ten nowy rodzaj języka jest interesujący do nauki, ponieważ jest połączeniem języków mówionych i pisanych. Na przykład tradycyjne pismo jest statyczne w porównaniu z dynamiczną naturą nowego języka w Internecie, w którym słowa mogą pojawiać się na ekranie komputera w różnych kolorach i rozmiarach czcionek. Jednak ten nowy rodzaj języka zawiera również inne elementy, których nie ma w językach naturalnych. Jednym z przykładów jest koncepcja ramek, którą można znaleźć w e-mailach i forach dyskusyjnych. Odpowiadając na e-maile, ludzie zazwyczaj używają wiadomości e-mail nadawcy jako ramki do pisania własnych wiadomości. Mogą wybrać odpowiedź na niektóre części wiadomości e-mail, pozostawiając inne fragmenty. Na forach dyskusyjnych można rozpocząć nowy wątek i każdy, niezależnie od swojej fizycznej lokalizacji, może odpowiedzieć na pomysł lub myśl, która została ustanowiona przez Internet. To jest coś, czego zwykle nie można znaleźć w języku pisanym.

Przyszłe badania obejmą także nowe odmiany wyrażeń, które Internet i jego różne technologie nieustannie wytwarza, a także ich wpływ nie tylko na języki pisane, ale także na ich formy mówione. Komunikatywny styl języka internetowego najlepiej można zaobserwować w poniższych kanałach CMC, ponieważ często podejmuje się próby przezwyciężenia ograniczeń technologicznych, takich jak opóźnienia w transmisji, oraz przywrócenia wskazówek społecznych, które często są niejasne w tekście pisanym.

Telefony komórkowe

Telefony komórkowe (zwane również telefonami komórkowymi) mają potencjał ekspresji wykraczający poza ich podstawowe funkcje komunikacyjne. Widać to w konkursach poetyckich na sms-y, takich jak ten organizowany przez The Guardian . Limit 160 znaków narzucony przez telefon komórkowy zmotywował użytkowników do ćwiczenia kreatywności językowej w celu ich pokonania. Podobnym przykładem nowej technologii z ograniczeniami znaków jest Twitter , który ma limit 280 znaków. Odbywają się debaty, czy te nowe skrócone formy wprowadzone w tweetach użytkowników są „leniwe”, czy też są kreatywnymi fragmentami komunikacji. Pomimo toczącej się debaty, nie ma wątpliwości, że Twitter przyczynił się do krajobrazu językowego nowymi żargonami, a także przyniósł nowy wymiar komunikacji.

Komórka stworzyła także nowy gatunek literacki – powieści na telefony komórkowe . Typowa powieść na telefon komórkowy składa się z kilku rozdziałów, które czytelnicy pobierają w krótkich odcinkach. Powieści te są w swojej „surowej” formie, ponieważ nie przechodzą procesów redakcyjnych, jak powieści tradycyjne. Są pisane krótkimi zdaniami, podobnymi do SMS-ów. Autorzy takich powieści mogą również otrzymywać informacje zwrotne i nowe pomysły od swoich czytelników poprzez e-maile lub internetowe kanały zwrotne. W przeciwieństwie do tradycyjnego pisania powieści, pomysły czytelników są czasami włączane do fabuły lub autorzy mogą również zdecydować się na zmianę fabuły swojej historii zgodnie z popytem i popularnością swojej powieści (zazwyczaj mierzoną liczbą odsłon). Pomimo ich popularności, krytykowano także „brak zróżnicowanego słownictwa” i słabą gramatykę powieści.

Blogi

Blogowanie przyniosło nowe sposoby pisania pamiętników, a z perspektywy językowej język używany na blogach jest „w swojej najbardziej „nagiej” formie, publikowany, aby świat mógł go zobaczyć bez poddawania się formalnemu procesowi redagowania. To właśnie wyróżnia blogi, ponieważ prawie wszystkie inne formy języka drukowanego przeszły jakąś formę edycji i standaryzacji. David Crystal stwierdził, że blogi były „początkiem nowego etapu w ewolucji języka pisanego”. Blogi stały się tak popularne, że wyszły poza pisane blogi, wraz z pojawieniem się fotoblogów , wideoblogów , audioblogów i moblogów . Te zmiany w interaktywnym blogowaniu stworzyły nowe konwencje i style językowe, a w przyszłości oczekuje się, że pojawi się więcej.

Wirtualne światy

Wirtualne światy zapewniają wgląd w to, w jaki sposób użytkownicy dostosowują użycie języka naturalnego do komunikacji w tych nowych mediach. Język internetowy, który powstał w wyniku interakcji użytkowników w tekstowych pokojach rozmów i światach symulowanych komputerowo , doprowadził do rozwoju slangu w społecznościach cyfrowych. Przykłady obejmują pwn i noob . Emotikony to kolejne przykłady dostosowania różnych wyrażeń przez użytkowników do ograniczeń komunikacji w cyberprzestrzeni, z których jednym jest „utrata emocji”.

Komunikacja w niszach, takich jak gry fabularne (RPG) w domenach wielu użytkowników (MUD) i światy wirtualne, jest wysoce interaktywna, z naciskiem na szybkość, zwięzłość i spontaniczność. W rezultacie CMC jest ogólnie bardziej żywy, niestabilny, nieustrukturyzowany i otwarty. W łączeniu wątków konwersacyjnych i krótkich zwojów widać często złożoną organizację sekwencji i struktury wymiany. Niektóre ze stosowanych strategii CMC obejmują pisanie wielkimi literami dla słów takich jak EMPHASIS , użycie symboli takich jak gwiazdka do zamykania słów widocznych w *stres* oraz kreatywne użycie znaków interpunkcyjnych, takich jak ???!?!?!? . Symbole są również używane w funkcjach dyskursu, takie jak gwiazdka jako konwersacyjny znacznik naprawy oraz strzałki i karaty jako deixis i znaczniki odniesienia . Poza przyczynianiem się do tworzenia nowych form językowych, wirtualne światy są również wykorzystywane do nauczania języków. Nauka języków w świecie wirtualnym zapewnia uczniom symulacje rzeczywistych środowisk, pozwalając im znaleźć kreatywne sposoby na poprawę swoich umiejętności językowych. Wirtualne światy są dobrymi narzędziami do nauki języków wśród młodszych uczniów, ponieważ widzą już takie miejsca jako „naturalne miejsce do nauki i zabawy”.

E-mail

Jedną z najpopularniejszych technologii związanych z Internetem, którą należy badać z tej perspektywy, jest poczta elektroniczna , która na wiele sposobów rozszerzyła stylistykę języków. Badanie przeprowadzone na profilu językowym wiadomości e-mail wykazało, że istnieje hybryda stylów mowy i pisania pod względem formatu, gramatyki i stylu. Poczta elektroniczna szybko zastępuje tradycyjne pisanie listów ze względu na wygodę, szybkość i spontaniczność. Często wiąże się to z nieformalnością, ponieważ wydaje się tymczasowe i można je łatwo usunąć. Jednak w miarę dojrzewania tego środka komunikacji poczta elektroniczna nie ogranicza się już do wysyłania nieformalnych wiadomości między przyjaciółmi i krewnymi. Zamiast tego coraz częściej korespondencja biznesowa odbywa się za pośrednictwem poczty elektronicznej. Osoby poszukujące pracy również używają e-maili do wysyłania swoich CV do potencjalnych pracodawców. Efektem ruchu w kierunku bardziej formalnych zastosowań będzie medium reprezentujące szereg stylistyki formalnej i nieformalnej.

Podczas gdy pocztę elektroniczną obwinia się za coraz częstsze używanie przez uczniów języka nieformalnego w ich pracach pisemnych, David Crystal twierdzi, że poczta elektroniczna nie jest zagrożeniem dla edukacji językowej, ponieważ e-mail z całym wachlarzem wyrazistości stylistycznej może działać jak domena dla osób uczących się języka umożliwiająca odpowiedzialne dokonywanie własnych wyborów językowych. Co więcej, wysoka skłonność młodszego pokolenia do korzystania z poczty elektronicznej może poprawić ich umiejętności pisania i komunikacji ze względu na wysiłki, jakie wkładają w formułowanie swoich myśli i pomysłów, chociaż za pomocą medium cyfrowego.

Wiadomości błyskawiczne

Podobnie jak inne formy komunikacji online, komunikatory internetowe mają również własne akronimy i krótkie formularze. Jednak wiadomości błyskawiczne różnią się znacznie od poczty e-mail i grup czatowych, ponieważ umożliwiają uczestnikom interakcję ze sobą w czasie rzeczywistym podczas prywatnej rozmowy. Wiadomości błyskawiczne zapewniają uczestnikom dodatkowy wymiar znajomości. Ten zwiększony stopień intymności pozwala na większą nieformalność w języku i „typograficzne dziwactwa”. Występują również większe przypadki zróżnicowania stylistycznego, ponieważ między uczestnikami może istnieć bardzo duża różnica wieku. Na przykład wnuczka może skontaktować się ze swoją babcią przez komunikator. W przeciwieństwie do grup czatowych, w których uczestnicy spotykają się ze wspólnymi zainteresowaniami, nie ma tutaj presji, aby dostosować się do języka.

Zastosowana perspektywa

Przyjęta perspektywa postrzega lingwistyczną eksploatację Internetu pod kątem jego możliwości komunikacyjnych – dobrych i złych. Internet stanowi platformę, na której użytkownicy mogą doświadczyć wielojęzyczności. Chociaż angielski jest nadal dominującym językiem używanym w Internecie, liczba użytkowników innych języków stopniowo rośnie. Strona Globalne korzystanie z Internetu zawiera informacje o liczbie użytkowników Internetu według języka, narodowości i położenia geograficznego. To wielojęzyczne środowisko stale zwiększa swoją różnorodność, ponieważ coraz więcej społeczności językowych łączy się z Internetem. Internet jest zatem platformą, na której języki mniejszościowe i zagrożone mogą starać się ożywić ich używanie i/lub zwiększyć świadomość. Można to zaobserwować w dwóch przypadkach, w których zapewnia tym językom możliwości postępu w dwóch ważnych aspektach – dokumentacji językowej i rewitalizacji języka .

Dokumentacja językowa

Po pierwsze, Internet ułatwia dokumentację językową . Cyfrowe archiwa mediów, takie jak nagrania audio i wideo, nie tylko pomagają zachować dokumentację językową, ale także umożliwiają globalne rozpowszechnianie za pośrednictwem Internetu. Rozpowszechnienie o zagrożonych językach, takie jak Webster (2003), pomogło w rozbudzeniu światowego zainteresowania dokumentacją językową.

Fundacje takie jak Hans Rausing Endangered Languages ​​Project (HRELP), finansowany przez firmę Arcadia, również pomagają rozwijać zainteresowanie dokumentacją językową. HRELP to projekt, którego celem jest m.in. dokumentacja zagrożonych języków, zachowanie i rozpowszechnianie materiałów dokumentacyjnych. Zgromadzone materiały są udostępniane online w ramach programu Endangered Languages ​​Archive (ELAR).

Inne materiały online, które wspierają dokumentację językową, obejmują biuletyn Language Archive, który zawiera wiadomości i artykuły na tematy w zagrożonych językach. Internetowa wersja Ethnologue zawiera również krótkie informacje o wszystkich znanych na świecie żywych językach. Udostępniając w Internecie zasoby i informacje o zagrożonych językach oraz dokumentację językową, umożliwia naukowcom korzystanie z tych materiałów, a tym samym zachowanie zagrożonych języków.

Rewitalizacja językowa

Po drugie, Internet ułatwia rewitalizację języka . Przez lata środowisko cyfrowe rozwijało się na różne wyrafinowane sposoby, które pozwalają na wirtualny kontakt. Od e-maili, czatów po komunikatory internetowe, te wirtualne środowiska pomogły zniwelować przestrzenną odległość między komunikatorami. Korzystanie z poczty elektronicznej zostało przyjęte na kursach językowych, aby zachęcić uczniów do komunikowania się w różnych stylach, takich jak formaty typu konferencyjnego, a także do generowania dyskusji. Podobnie korzystanie z poczty elektronicznej ułatwia rewitalizację językową w tym sensie, że osoby posługujące się językiem mniejszości, które przeniosły się do miejsca, w którym ich język ojczysty nie jest używany, mogą wykorzystać Internet do komunikacji z rodziną i przyjaciółmi, utrzymując w ten sposób używanie ich ojczystego języka. Wraz z rozwojem i coraz większym wykorzystaniem szerokopasmowej komunikacji telefonicznej, takiej jak Skype , rewitalizacja języka za pośrednictwem Internetu nie jest już ograniczona do piśmiennych użytkowników.

Hawańscy edukatorzy wykorzystują Internet w swoich programach rewitalizacji języka. System graficznej tablicy ogłoszeń, Leoki (Powerful Voice), powstał w 1994 roku. Zawartość, interfejs i menu systemu są w całości w języku hawajskim. Jest instalowany w całym systemie szkoły zanurzenia i zawiera między innymi komponenty do e-maili, czatu, słownika i gazety internetowej. W instytucjach wyższych, takich jak uczelnie i uniwersytety, gdzie system Leoki nie jest jeszcze zainstalowany, nauczyciele korzystają z innego oprogramowania i narzędzi internetowych, takich jak Daedalus Interchange, e-maile i Internet, aby łączyć studentów języka hawajskiego z szerszą społecznością.

Innym zastosowaniem Internetu jest umożliwienie studentom języków mniejszości pisania o swoich kulturach ojczystych w językach ojczystych dla odległych odbiorców. Ponadto, próbując zachować swój język i kulturę, użytkownicy prowansalscy korzystają z Internetu, aby dotrzeć do innych użytkowników prowansalskich z całego świata. Metody te dostarczają powodów do posługiwania się językami mniejszości poprzez porozumiewanie się w nim. Ponadto korzystanie z technologii cyfrowych, które młode pokolenie uważa za „fajne”, spodoba im się, a co za tym idzie, utrzyma zainteresowanie i używanie ich języków ojczystych.

Eksploatacja Internetu

Internet może być również wykorzystywany do działań takich jak terroryzm , oszustwa internetowe i pedofilia . W ostatnich latach nastąpił wzrost przestępstw związanych z korzystaniem z Internetu, takich jak poczta elektroniczna i Internet Relay Chat (IRC), ponieważ zachowanie anonimowości jest stosunkowo łatwe. Te spiski niosą ze sobą obawy o bezpieczeństwo i ochronę. Z kryminalistycznego punktu widzenia istnieje wiele potencjalnych obszarów do zbadania. Chociaż opracowanie procedury ochrony dzieci w czacie czatu opartej na filtrowaniu wyszukiwanych haseł jest skuteczne, nadal istnieje minimalna literatura zorientowana na język, aby ułatwić to zadanie. W innych obszarach obserwuje się zaangażowanie Sieci Semantycznej w zadania takie jak ochrona danych osobowych , co pomaga zapobiegać oszustwom.

Wymiary

Wymiary omówione w tej sekcji obejmują spojrzenie na sieć jako korpus oraz kwestie identyfikacji i normalizacji języka. Wpływ lingwistyki internetowej na życie codzienne badany jest pod wpływem stylistyki internetowej, trendów zmian językowych w Internecie oraz dyskursu konwersacyjnego.

Sieć jako korpus

Ponieważ Internet jest ogromnym rezerwuarem danych i zasobów, naukowcy i technolodzy języków coraz częściej zwracają się do sieci w celu uzyskania danych językowych. Corpora została po raz pierwszy formalnie wymieniona w dziedzinie lingwistyki komputerowej na spotkaniu ACL w Vancouver w 1989 roku. Spotkało się to z wieloma kontrowersjami, ponieważ brakowało im teoretycznej integralności, co prowadziło do dużego sceptycyzmu co do ich roli w tej dziedzinie, aż do czasu publikacji czasopisma „Using Large Corpora” w 1993 r., w którym związek między lingwistyką obliczeniową a korpusami stał się powszechnie akceptowany.

Aby ustalić, czy sieć jest korpusem, warto sięgnąć do definicji stworzonej przez McEnery i Wilson (1996, s. 21).

W zasadzie każdy zbiór składający się z więcej niż jednego tekstu można nazwać korpusem. . . . Ale termin „korpus” używany w kontekście nowoczesnego językoznawstwa ma najczęściej bardziej specyficzne konotacje, niż przewiduje ta prosta definicja. Można je rozpatrywać pod czterema głównymi nagłówkami: pobieranie próbek i reprezentatywność, skończony rozmiar, forma do odczytu maszynowego, odniesienie standardowe.

—  Tony McEnery i Andrew Wilson, lingwistyka korpusowa

Odnosząc się bliżej do sieci jako korpusu, Manning i Schütze (1999, s. 120) dodatkowo upraszczają definicję:

W Statistical NLP [Natural Language Processing] często otrzymuje się jako korpus pewną ilość danych z pewnej dziedziny zainteresowania, nie mając nic do powiedzenia na temat jej konstrukcji. W takich przypadkach posiadanie większej ilości danych treningowych jest zwykle bardziej przydatne niż jakiekolwiek problemy związane z równowagą i należy po prostu użyć całego dostępnego tekstu.

—  Christopher Manning i Hinrich Schütze, Podstawy statystycznego przetwarzania języka

Liczby trafień zostały wykorzystane do starannie skonstruowanych zapytań wyszukiwarek, aby zidentyfikować rzędy rang dla częstotliwości sensu słowa, jako dane wejściowe do silnika ujednoznaczniania sensu słowa. Metodę tę zbadano dalej, wprowadzając koncepcję równoległych korpusów, w których łączy się istniejące strony internetowe, które istnieją równolegle w językach lokalnych i głównych. Wykazano, że z jednego dokumentu w tym języku można zbudować korpus językowy.

Motywy

Odbyło się wiele dyskusji na temat możliwych zmian na arenie Internetu jako korpusu. Rozwój wykorzystania sieci jako źródła danych do ujednoznacznienia sensu słów nastąpił w projekcie The EU MEANING w 2002 roku. Wykorzystano w nim założenie, że w obrębie domeny słowa mają często jedno znaczenie i że domeny można zidentyfikować w sieci. Zostało to dalej zbadane przy użyciu technologii sieciowej do zbierania ręcznych adnotacji związanych z sensem słów w witrynie internetowej Word Expert.

W obszarach modelowania języka sieć została wykorzystana do rozwiązania problemu rzadkości danych. Statystyki leksykalne zostały zebrane w celu rozwiązania załączników do fraz przyimkowych, podczas gdy dokumenty internetowe były używane do szukania równowagi w korpusie.

W obszarach wyszukiwania informacji ścieżka internetowa została zintegrowana jako element wspólnotowej inicjatywy oceny TREC. Próbka sieci wykorzystana w tym ćwiczeniu zajmuje około 100 GB, narażając na szwank głównie dokumenty w domenie najwyższego poziomu .gov.

Brytyjski Korpus Narodowy

British National Corpus zawiera obszerne informacje na temat dominujących znaczeń i wzorców użycia do 10.000 słów, które tworzy rdzeń angielskim.

Liczba słów w Brytyjskim Korpusie Narodowym (ok. 100 mln) wystarcza dla wielu empirycznych strategii uczenia się o języku dla lingwistów i leksykografów i jest zadowalająca dla technologii, które wykorzystują informacje ilościowe o zachowaniu słów jako dane wejściowe (parsowanie).

Jednak do innych celów jest to niewystarczające, ze względu na zipfijską naturę częstotliwości słów. Ponieważ większość zasobu leksykalnego występuje mniej niż 50 razy w Brytyjskim Korpusie Narodowym, to nie wystarcza do uzyskania statystycznie stabilnych wniosków na temat takich słów. Ponadto w przypadku niektórych rzadszych słów, rzadkich znaczeń popularnych słów i kombinacji słów nie znaleziono żadnych danych. Naukowcy odkryli, że probabilistyczne modele języka oparte na bardzo dużych ilościach danych są lepsze niż modele oparte na szacunkach z mniejszych, czystszych zbiorów danych.

Wielojęzyczna sieć

Sieć jest wyraźnie wielojęzycznym korpusem. Szacuje się, że 71% stron (453 miliony z 634 milionów stron internetowych zindeksowanych przez silnik Excite) było napisanych w języku angielskim, a następnie w języku japońskim (6,8%), niemieckim (5,1%), francuskim (1,8%), chińskim (1,5%), hiszpański (1,1%), włoski (0,9%) i szwedzki (0,7%).

Test na znalezienie ciągłych słów, takich jak „głęboki oddech”, ujawnił 868 631 stron internetowych zawierających terminy w AlltheWeb . Liczba znaleziona w wyszukiwarkach jest ponad trzykrotnie większa od liczby wygenerowanej przez British National Corpus, co wskazuje na znaczny rozmiar angielskiego korpusu dostępnego w sieci.

Ogromny rozmiar tekstu dostępnego w sieci widać po analizie kontrolowanych danych, w których korpusy różnych języków mieszały się w różnych proporcjach. Szacowany rozmiar strony internetowej w słowach AltaVista sprawił, że angielski znalazł się na szczycie listy z 76 598 718 000 słów. Następny jest niemiecki z 7 035 850 000 słów wraz z 6 innymi językami z ponad miliardem trafień. Nawet języki o mniejszej liczbie odwiedzin w sieci, takie jak słoweński, chorwacki, malajski i turecki, mają w sieci ponad sto milionów słów. Ujawnia to potencjalną siłę i dokładność korzystania z sieci jako korpusu, biorąc pod uwagę jej znaczny rozmiar, co uzasadnia wiele dodatkowych badań, takich jak projekt realizowany obecnie przez brytyjski Korpus Narodowy w celu wykorzystania jego skali.

Wyzwania

W obszarach modelowania języka istnieją ograniczenia dotyczące stosowalności dowolnego modelu językowego, ponieważ statystyki dla różnych typów tekstu będą różne. Kiedy aplikacja technologii językowej jest wprowadzana do użytku (zastosowana do nowego typu tekstu), nie jest pewne, czy model językowy będzie działał tak samo, jak w przypadku zastosowania do korpusu szkoleniowego. Stwierdzono, że istnieją znaczne różnice w wydajności modelu, gdy zmienia się korpus treningowy. Ten brak typów teorii ogranicza ocenę przydatności pracy z modelowaniem języka.

Ponieważ teksty internetowe są łatwe w tworzeniu (pod względem kosztów i czasu) i gdy nad nimi pracuje wielu różnych autorów, często nie ma to większego wpływu na dokładność. Błędy gramatyczne i typograficzne są uważane za „błędne” formy, które powodują, że sieć jest brudnym korpusem. Mimo to może się przydać nawet przy niewielkim hałasie.

Nierozstrzygnięta pozostaje kwestia, czy uwzględnić podjęzyki . Zwolennicy tego argumentu twierdzą, że usunięcie wszystkich podjęzyków spowoduje zubożały pogląd na język. Ponieważ język składa się z leksykonów, gramatyki i szerokiej gamy różnych podjęzyków, należy je uwzględnić. Jednak dopiero niedawno stała się realną opcją. Uderzanie w kompromis poprzez uwzględnienie niektórych podjęzyków jest kontrowersyjne, ponieważ jest to arbitralna kwestia, które należy uwzględnić, a które nie.

Decyzja o tym, co umieścić w korpusie, należy do twórców korpusu i zostało to zrobione z pragmatyzmem. Dezyderaty i kryteria użyte w Brytyjskim Korpusie Narodowym służą jako dobry model dla korpusu ogólnego przeznaczenia, w języku ogólnojęzykowym, z naciskiem na to, by reprezentatywność zastępowana była byciem zrównoważonym. .

Wyszukiwarki, takie jak Google, służą jako domyślny sposób dostępu do sieci i jej szerokiej gamy zasobów językowych. Jednak dla językoznawców zajmujących się korpusami, istnieje szereg wyzwań. Obejmuje to ograniczone wystąpienia prezentowane przez wyszukiwarki (maksymalnie 1000 lub 5000); niewystarczający kontekst dla każdej instancji (Google podaje fragment około dziesięciu słów); wyniki wybierane według kryteriów, które są zniekształcone (z językowego punktu widzenia), ponieważ wyszukiwane hasło w tytułach i nagłówkach często zajmuje pierwsze miejsca w wynikach; niemożność umożliwienia określenia wyszukiwania według kryteriów językowych, takich jak forma cytowania słowa lub klasa słów; nierzetelność statystyk, wyniki różniące się w zależności od obciążenia wyszukiwarki i wielu innych czynników. Obecnie, ze względu na konflikty priorytetów pomiędzy różnymi interesariuszami, najlepszym rozwiązaniem jest podjęcie przez językoznawców próby samodzielnego rozwiązania tych problemów. Doprowadzi to z kolei do otwarcia wielu możliwości w zakresie wykorzystania bogatego potencjału sieci.

Reprezentacja

Pomimo ogromnego rozmiaru sieci, może ona nadal nie być reprezentatywna dla wszystkich języków i domen na świecie, podobnie jak inne korpusy. . Jednak ogromne ilości tekstu, w wielu językach i typach językowych, dotyczące ogromnej liczby tematów, sprawiają, że jest to dobry punkt wyjścia, który otwiera wiele możliwości w badaniu korpusów.

Wpływ jego rozprzestrzeniania się i wpływu

Stylistyka wynikająca z korzystania z Internetu rozprzestrzeniła się poza nowe media na inne obszary i platformy, w tym między innymi filmy , muzykę i dzieła literackie . Infiltracja stylistyki internetowej jest ważna, ponieważ masowa publiczność ma kontakt z dziełami, wzmacniając pewne specyficzne dla Internetu style językowe, które mogą być nie do przyjęcia w standardowych lub bardziej formalnych formach językowych.

Oprócz slangu internetowego, błędy gramatyczne i błędy typograficzne to cechy pisania w Internecie i innych kanałach CMC. W miarę jak użytkownicy Internetu przyzwyczajają się do tych błędów, stopniowo przenikają one do codziennego użytku, zarówno w formie pisemnej, jak i ustnej. Często zdarza się również, że takie błędy występują w pracach środków masowego przekazu, od błędów typograficznych w artykułach prasowych po błędy gramatyczne w reklamach, a nawet slang internetowy w dialogach dramatycznych.

Im bardziej internet jest włączony w codzienne życie, tym większy wpływ ma na język formalny. Jest to szczególnie prawdziwe na nowoczesnych zajęciach z języka angielskiego poprzez korzystanie ze smartfonów, tabletów i mediów społecznościowych. Uczniowie są bardziej niż kiedykolwiek narażeni na język Internetu, dlatego struktura gramatyczna i slang Internetu wlewają się w ich formalne pisarstwo. Pełne zanurzenie w języku jest zawsze najlepszym sposobem na jego naukę. Mark Lester w swojej książce Teaching Grammar and Usage stwierdza: „Największym pojedynczym problemem, jaki mają zwykli pisarze w opracowywaniu skutecznych strategii radzenia sobie z błędami, jest po prostu brak kontaktu z formalnym językiem angielskim. opanować język obcy bez nadmiernego kontaktu z nim.” Ponieważ studenci są zanurzeni w języku internetowym, to jest forma i struktura, którą odzwierciedlają.

Ponadto rozwój Internetu i ogólne zanurzenie w nim ludzi spowodowało nową falę aktywizmu internetowego, który ma wpływ na opinię publiczną każdego dnia. .

Memy

Pochodzenie terminu „ meme ” można prześledzić wstecz do Richarda Dawkinsa , w Etolog , gdzie opisuje go jako „rzeczownika, który przekazuje ideę jednostki transmisji kulturowej, albo zjednoczyć naśladowania.” Termin ten został później zaadaptowany do świata Internetu przez Davida Beskowa, Sumeeta Kumar i Kathleen Carley , gdzie memy internetowe nazwali „każdą cyfrową jednostką przekazującą kulturę”.

Środki masowego przekazu

Zdarzały się przypadki reklam telewizyjnych wykorzystujących internetowy slang, wzmacniający penetrację stylistyki internetowej w codziennym użyciu języka. Na przykład w reklamie Cingular w Stanach Zjednoczonych użyto akronimów, takich jak „BFF Jill” (co oznacza „Best Friend Forever, Jill”). Coraz więcej firm przyjęło użycie slangu internetowego w swoich reklamach, ponieważ im więcej osób dorasta, korzystając z Internetu i innych platform CMC, próbując nawiązać z nimi lepszy kontakt i połączyć się z nimi. . Takie reklamy spotkały się ze stosunkowo entuzjastycznym odzewem ze strony odbiorców.

Użycie żargonu internetowego rozprzestrzeniło się również na arenę muzyczną, co jest wyraźnie widoczne w muzyce popularnej . Niedawnym przykładem jest tekst Treya Songza do „LOL :-)”, który zawiera wiele żargonów internetowych i wzmianki o Twitterze i SMS-ach.

Rozpowszechnienie lingwistyki internetowej jest również obecne w filmach realizowanych zarówno przez twórców komercyjnych, jak i niezależnych . Choć pokazywane są głównie na festiwalach filmowych , płyty DVD z filmami niezależnymi są często dostępne w sprzedaży przez Internet, w tym w ramach płatnych transmisji na żywo, dzięki czemu dostęp do filmów jest łatwiejszy dla publiczności. Sam charakter filmów komercyjnych wyświetlanych w publicznych kinach pozwala na szerokie wystawienie się na masową publiczność głównego nurtu, co skutkuje szybszym i szerszym rozprzestrzenianiem się slangu internetowego. Najnowszy film komercyjny jest zatytułowany "lol" (akronim śmiać się głośno lub Laughing Out Loud ), z udziałem Miley Cyrus i Demi Moore . Ten film jest remake'em popularnego francuskiego filmu Lisy Azuelos z 2008 roku, podobnie zatytułowanego " LOL (Laughing Out Loud) ".

Używanie slangów internetowych nie ogranicza się do języka angielskiego, ale obejmuje również inne języki. Język koreański zawiera alfabet angielski w tworzeniu swojego slangu, podczas gdy inne powstały z typowych błędów ortograficznych wynikających z szybkiego pisania. Nowy koreański slang jest dodatkowo wzmacniany i wprowadzany do codziennego języka w programach telewizyjnych, takich jak opery mydlane lub dramaty komediowe, takie jak „ High Kick Through the Roof ” wydany w 2009 roku.

Językowa przyszłość Internetu

Wraz z pojawieniem się większych systemów komunikacji za pośrednictwem komputera/Internetu, w połączeniu z gotowością, z jaką ludzie przystosowują się do nowych wymagań bardziej wyrafinowanego technologicznie świata, oczekuje się, że użytkownicy nadal będą pod presją, aby zmienić swój język tak, aby odpowiadał nowe wymiary komunikacji.

Ponieważ liczba użytkowników Internetu na całym świecie gwałtownie rośnie, tło kulturowe, przyzwyczajenia językowe i różnice językowe między użytkownikami są wprowadzane do sieci w znacznie szybszym tempie. Przewiduje się, że te indywidualne różnice między użytkownikami Internetu znacząco wpłyną na przyszłość językoznawstwa internetowego, zwłaszcza w aspekcie sieci wielojęzycznej. Jak widać w latach 2000-2010, penetracja Internetu odnotowała największy wzrost w krajach nieanglojęzycznych, takich jak Chiny i Indie oraz w krajach afrykańskich, co spowodowało, że do sieci przeniknęło więcej języków poza angielskim.

Przewiduje się również, że interakcja między angielskim a innymi językami będzie ważnym obszarem studiów. Ponieważ globalni użytkownicy wchodzą ze sobą w interakcję, możliwe odniesienia do różnych języków mogą nadal wzrastać, co skutkuje tworzeniem nowej stylistyki internetowej obejmującej różne języki. Języki chiński i koreański już doświadczyły infiltracji języka angielskiego, co doprowadziło do powstania ich wielojęzycznego żargonu internetowego.

W obecnym stanie Internet stanowi formę edukacji i promocji języków mniejszościowych. Jednak podobnie jak interakcja między językami spowodowała infiltrację języka angielskiego do języków chińskiego i koreańskiego, tworząc nowe slangi, języki mniejszości są również dotknięte przez bardziej popularne języki używane w Internecie (takie jak angielski i hiszpański). Podczas gdy interakcja językowa może spowodować utratę autentycznego standardu języków mniejszości, znajomość języka większości może również negatywnie wpłynąć na języki mniejszości. Na przykład, użytkownicy próbujący nauczyć się języka mniejszości mogą zdecydować się na przeczytanie i zrozumienie tego języka w języku większości i na tym poprzestać, co skutkuje stratą zamiast zyskiem potencjalnych użytkowników języka mniejszości. Również osoby mówiące językami mniejszości mogą być zachęcane do nauki bardziej popularnych języków, które są używane w sieci w celu uzyskania dostępu do większej ilości zasobów, co z kolei prowadzi do spadku używania przez nich własnego języka. Przyszłość zagrożonych języków mniejszościowych w związku z rozprzestrzenianiem się Internetu pozostaje do obserwacji.

Zobacz też

Bibliografia

Dalsza lektura

  • Aitchison, J. i Lewis, DM (wyd.). (2003). Nowy język mediów. Londyn i Nowy Jork: Routledge. ISBN  0-415-28303-5
  • Baron, NS (2000). Alfabet do e-maila: jak ewoluował język angielski i dokąd zmierza. Londyn i Nowy Jork: Routledge. ISBN  0-415-18685-4
  • Broda, A. (2004). Zmiana języka. Londyn i Nowy Jork: Routledge. ISBN  0-415-32056-9
  • Biewer, C., Nesselhauf, N. i Hundt, M. (red.). (2006). Językoznawstwo korpusowe i sieć internetowa. Holandia: Rodopi. ISBN  90-420-2128-4
  • Boardman, M. (2005). Język stron internetowych. Nowy Jork i Londyn: Routledge. ISBN  0-415-32854-3
  • Kryształ, D. (2004). Słownik Netspeak i Textspeak. Edynburg: Edinburgh University Press. ISBN  0-7486-1982-8
  • Kryształ, D. (2004). Rewolucja językowa (Tematy XXI wieku). Wielka Brytania: Polity Press Ltd. ISBN  0-7456-3312-9
  • Kryształ, D. (2006). Język i Internet (wyd. 2). Cambridge: Wydawnictwo Uniwersytetu Cambridge. ISBN  978-0-521-86859-4
  • Kryształ, D. (2011). Językoznawstwo internetowe: przewodnik dla uczniów. Nowy Jork: Routledge. ISBN  978-0-415-60271-6
  • Dieter, J. (2007). Webliteralität: Lesen und Schreiben w sieci WWW. ISBN  3-8334-9729-7
  • Enteen, J. (2010). Wirtualny angielski: korzystanie z Internetu, język i tematy globalne. Londyn i Nowy Jork: Routledge. ISBN  0-415-97724-X
  • Gerrand, P. (2009). Języki mniejszości w Internecie: promowanie języków regionalnych Hiszpanii. Wersja VDM. ISBN  3-639-19111-0
  • Gibbs, D. i Krause, K. (red.). (2006). Cyberlines 2.0.: Języki i kultury Internetu. Australia: James Nicholas Publishers. ISBN  1-875408-42-8
  • Jenkins, J. (2003). World Englishes: książka informacyjna dla studentów. Londyn i Nowy Jork: Routledge. ISBN  0-415-25806-5
  • Macfadyen, LP, Roche, J. i Doff, S. (2005). Komunikacja między kulturami w cyberprzestrzeni: przegląd bibliograficzny komunikacji międzykulturowej w Internecie. Świeci Verlag. ISBN  3-8258-7613-6
  • Thurlow, C., Lengel, LB i Tomic, A. (2004). Komunikacja za pośrednictwem komputera: interakcje społeczne i Internet. Londyn: Sage Publikacje. ISBN  0-7619-4954-2