Gramatyka operatora - Operator grammar

Gramatyka operatora to matematyczna teoria języka ludzkiego, która wyjaśnia, w jaki sposób język przenosi informacje . Teoria ta jest kulminacją dorobku życiowego Zelliga Harrisa , którego główne publikacje pojawiły się pod koniec ubiegłego wieku. Gramatyka operatora zakłada, że ​​każdy język ludzki jest samoorganizującym się systemem, w którym zarówno składniowe, jak i semantyczne właściwości słowa są ustalone wyłącznie w odniesieniu do innych słów. Zatem żaden system zewnętrzny ( metajęzyk ) nie jest wymagany do określenia reguł języka. Zamiast tego, reguł tych uczy się poprzez ekspozycję na użycie i poprzez uczestnictwo, jak ma to miejsce w przypadku większości zachowań społecznych . Teoria jest zgodna z ideą, że język ewoluował stopniowo, a każde kolejne pokolenie wprowadzało nową złożoność i zmienność.

Gramatyka operatora zakłada trzy uniwersalne ograniczenia: zależność (niektóre słowa zależą od obecności innych słów tworzących wypowiedź), prawdopodobieństwo (niektóre kombinacje słów i ich zależności są bardziej prawdopodobne niż inne) i redukcja (słowa w kombinacjach o wysokim prawdopodobieństwie można zredukować do krótszych form, a czasami całkowicie pomijane). Razem tworzą one teorię informacji językowej : zależność buduje strukturę predykat-argument ; prawdopodobieństwo tworzy różne znaczenia; redukcja pozwala na zwarte formy komunikacji.

Zależność

Podstawowym mechanizmem gramatyki operatorowej jest ograniczenie zależności: niektóre słowa ( operatory ) wymagają, aby w wypowiedzi było obecne jedno lub więcej słów (argumentów). W zdaniu John nosi buty , operator nosi wymaga obecności dwóch argumentów, takich jak John i buty . (Ta definicja zależności różni się od innych gramatyki zależności, w których mówi się, że argumenty zależą od operatorów.)

W każdym języku relacja zależności między słowami prowadzi do kategorii syntaktycznych, w których dopuszczalne argumenty operatora są zdefiniowane w kategoriach ich wymagań dotyczących zależności. Klasa N zawiera słowa (np. Jan , buty ), które nie wymagają obecności innych słów. Klasa O N zawiera słowa (np. Potknięcie ), które wymagają dokładnie jednego słowa typu N. Klasa O NN zawiera słowa (np. Nosić ), które wymagają dwóch słów typu N. Klasa O OO zawiera słowa (np. Ponieważ ), które wymagają dwóch słowa typu O, jak w John potyka się, ponieważ John nosi buty . Inne klasy obejmują O O (np. Jest możliwe ), O NNN (np. Umieścić ), O ON (np. Z ), O NIE (np. Wiedzieć ), O NNO (np. Zapytaj ) i O NOO (np. Atrybut ).

Kategorie w gramatyce operatorów są uniwersalne i są definiowane wyłącznie w kategoriach tego, jak słowa odnoszą się do innych słów i nie opierają się na zewnętrznym zestawie kategorii, takich jak rzeczownik, czasownik, przymiotnik, przysłówek, przyimek, koniunkcja itp. Właściwości zależności każdego słowa można zaobserwować poprzez użycie, a zatem można się ich nauczyć.

Prawdopodobieństwo

Ograniczenie zależności tworzy strukturę (składnię), w której dowolne słowo odpowiedniej klasy może być argumentem dla danego operatora. Ograniczenie prawdopodobieństwa nakłada dodatkowe ograniczenia na tę strukturę, sprawiając, że niektóre kombinacje operatorów / argumentów są bardziej prawdopodobne niż inne. Tak więc John nosi czapki jest bardziej prawdopodobne niż John nosi śnieg, co z kolei jest bardziej prawdopodobne niż John nosi wakacje . Ograniczenie prawdopodobieństwa tworzy znaczenie (semantykę), definiując każde słowo w kategoriach słów, które może przyjąć jako argumenty lub których może być argumentem.

Każde słowo ma unikalny zestaw słów, z którymi zaobserwowano, zwany jego wyborem . Spójne wybór wyrazu jest zbiorem słów, dla których relacja zależność ma powyżej średniej prawdopodobieństwa. Słowa o podobnym znaczeniu mają podobny spójny wybór. Takie podejście do znaczenia jest samoorganizujące się, ponieważ żaden system zewnętrzny nie jest potrzebny do zdefiniowania znaczenia słów. Zamiast tego znaczenie słowa jest określane przez jego użycie w populacji użytkowników. Wzorce częstego używania są obserwowalne i dlatego można się ich nauczyć. Nowe słowa można wprowadzić w dowolnym momencie i zdefiniować poprzez użycie.

W tym sensie gramatykę linków można postrzegać jako rodzaj gramatyki operatorów, ponieważ powiązanie słów jest określane całkowicie przez ich kontekst, a każdemu wyborowi przypisuje się logiczne prawdopodobieństwo.

Zmniejszenie

Ograniczenie redukcyjne działa na kombinacje operatorów i argumentów o wysokim prawdopodobieństwie i tworzy bardziej zwarte formy. Pewne redukcje pozwalają na całkowite pominięcie słów w wypowiedzi. Na przykład, spodziewam John przyjść sprowadza się do Spodziewam Jana , bo przyjść jest wysoce prawdopodobne pod spodziewać . Zdanie John nosi buty, a Jan nosi kapelusze, można zredukować do tego, że John nosi buty i czapki, ponieważ powtórzenie pierwszego argumentu Jan pod operatorem i jest wysoce prawdopodobne. John czyta rzeczy można sprowadzić do Jana czyta , ponieważ argumenty rzeczy mają duże prawdopodobieństwo wystąpienia pod dowolnym operatorem.

Niektóre redukcje redukują słowa do krótszych form, tworząc zaimki, sufiksy i przedrostki ( morfologia ). John nosi buty, a John nosi kapelusze, można zredukować do Johna nosi buty i nosi kapelusze , gdzie zaimek on jest zredukowaną formą Johna . Sufiksy i przedrostki można uzyskać, dołączając inne swobodnie występujące słowa lub ich warianty. John jest lubiany, może być zredukowany do tego, że John jest lubiany . John jest miło jest zmniejszona z Jana jest pełna myśli , a John jest antywojenny z John jest przeciwko wojnie .

Modyfikatory są wynikiem kilku z tych rodzajów ulg, które dają podstawę do przymiotników, przysłówków, wyrażeń przyimkowych , zdań podrzędnych , itp

  1. John nosi buty; buty są ze skóry (dwa zdania połączone średnikiem ) →
  2. Jan nosi skórzane buty (redukcja powtarzającego się rzeczownika do zaimka względnego ) →
  3. Jan nosi skórzane buty (pominięcie frazy wysokiego prawdopodobieństwa, które są ) →
  4. John nosi buty skórzane (pominięcie dużej operatorem prawdopodobieństwa z , transpozycji krótkiej modyfikatora na lewo od rzeczownika)

Każdy język ma unikalny zestaw obniżek. Na przykład niektóre języki mają morfologię, a inne nie; niektóre transponują krótkie modyfikatory, a inne nie. Każde słowo w języku uczestniczy tylko w pewnych rodzajach redukcji. Jednak w każdym przypadku zredukowany materiał można zrekonstruować na podstawie wiedzy o tym, co jest prawdopodobne w danej kombinacji operator / argument. Redukcje, w których uczestniczy każde słowo, są obserwowalne, a zatem możliwe do nauczenia, tak jak uczymy się zależności słowa i właściwości prawdopodobieństwa.

Informacja

Znaczenie redukcji w gramatyce operatorów polega na tym, że oddzielają zdania zawierające zredukowane formy od tych, które ich nie zawierają (zdania podstawowe). Wszystkie redukcje są parafrazami , ponieważ nie usuwają żadnych informacji, a jedynie sprawiają, że zdania są bardziej zwarte. Zatem zdania podstawowe zawierają wszystkie informacje o języku, a zdania zredukowane są ich wariantami. Zdania podstawowe składają się z prostych słów bez modyfikatorów iw dużej mierze bez afiksów, np. Opady śniegu , owce jedzą trawę , Jan wie , że owce jedzą trawę , że owce jedzą śnieg zaskakuje Johna .

Każdy operator w zdaniu wnosi wkład w informacje zgodnie z prawdopodobieństwem wystąpienia z jego argumentami. Wysoce oczekiwane kombinacje zawierają mało informacji; rzadkie kombinacje zawierają dużo informacji. Dokładny udział operatora zależy od jego doboru, zbioru słów, z którymi występuje z dużą częstotliwością. Argumenty buty , czapki , owce , trawa i śnieg różnią się znaczeniem w zależności od operatorów, dla których z dużym prawdopodobieństwem mogą pojawić się na pierwszej lub drugiej pozycji argumentu. Na przykład oczekuje się , że śnieg będzie pierwszym argumentem dotyczącym upadku, ale nie jedzenia , podczas gdy w przypadku owiec jest odwrotnie . Podobnie, operatorzy jedzą , pożerają , żują i połykają różnią się znaczeniem w takim stopniu, w jakim argumenty, które wybierają, i operatorzy, którzy je wybierają, różnią się.

Gramatyka operatorów przewiduje, że informacja zawarta w zdaniu jest akumulacją elementów składowych każdego argumentu i operatora. Przyrost informacji, które dane słowo dodaje do nowego zdania, zależy od tego, w jaki sposób zostało użyte wcześniej. Z kolei nowe zastosowania rozciągają lub nawet zmieniają treść informacyjną związaną ze słowem. Ponieważ proces ten opiera się na używaniu dużej częstotliwości, znaczenie słów jest względnie stabilne w czasie, ale może zmieniać się zgodnie z potrzebami społeczności językowej.

Bibliografia

  • Harris , Zellig (1982), A Grammar of English on Mathematical Principles , New York: John Wiley and Sons, ISBN   0-471-02958-0
  • Harris , Zellig (1988), Język i informacje , Nowy Jork: Columbia University Press, ISBN   0-231-06662-7
  • Harris , Zellig (1989), The Form of Information in Science: Analysis of an immunology sublanguage , Springer, ISBN   90-277-2516-0
  • Harris , Zellig (1991), A Theory of Language and Information: A Mathematical Approach , Oxford University Press, USA, ISBN   0-19-824224-7