Konsekwencje tekstowe - Textual entailment

Wynikanie tekstowe ( TE ) w przetwarzaniu języka naturalnego jest kierunkową relacją między fragmentami tekstu. Relacja zachodzi zawsze, gdy prawda jednego fragmentu tekstu wynika z innego tekstu. W ramach TE pociągające za sobą i wynikające z nich teksty nazywane są odpowiednio tekstem ( t ) i hipotezą ( h ). Wynikanie tekstowe nie jest tym samym, co konsekwencja czysto logiczna  - ma bardziej swobodną definicję: „ t pociąga za sobą h ” ( t h ), jeśli zazwyczaj ludzka lektura t wnioskowałaby, że h jest najprawdopodobniej prawdą. (Alternatywnie: t h wtedy i tylko wtedy, gdy typowo ludzka interpretacja t byłaby uzasadniona w wywnioskowaniu zdania wyrażonego przez h ze zdania wyrażonego przez t .) Relacja jest kierunkowa, ponieważ nawet jeśli „ t pociąga za sobą h ”, odwrotnie „ h pociąga za sobą t ” jest znacznie mniej pewne.

Ustalenie, czy ta relacja zachodzi, jest zadaniem nieformalnym, które czasami pokrywa się z zadaniami formalnymi semantyki formalnej (spełnienie warunku ścisłego oznacza zwykle spełnienie mniej rygorystycznego warunku); dodatkowo, pociąganie tekstowe częściowo obejmuje wynikanie słów .

Przykłady

Konsekwencję tekstową można zilustrować przykładami trzech różnych relacji:

Przykład pozytywnego TE (tekst zawiera hipotezę) to:

  • tekst: Jeśli pomożesz potrzebującym, Bóg cię wynagrodzi .
hipoteza: Dawanie pieniędzy biednemu człowiekowi ma dobre konsekwencje .

Przykładem negatywnego TE (tekst zaprzecza hipotezie) jest:

  • tekst: Jeśli pomożesz potrzebującym, Bóg cię wynagrodzi .
hipoteza: Dawanie pieniędzy biednemu człowiekowi nie ma konsekwencji .

Przykład non-TE (tekst nie pociąga za sobą ani nie zaprzecza) to:

  • tekst: Jeśli pomożesz potrzebującym, Bóg cię wynagrodzi .
hipoteza: Dawanie pieniędzy biednemu człowiekowi uczyni cię lepszym człowiekiem .

Niejednoznaczność języka naturalnego

Cechą charakterystyczną języka naturalnego jest to, że istnieje wiele różnych sposobów wyrażenia tego, co chce się powiedzieć: w jednym tekście można zawrzeć kilka znaczeń, a to samo znaczenie można wyrazić w różnych tekstach. Ta zmienność wyrażeń semantycznych może być postrzegana jako podwójny problem niejednoznaczności językowej. Razem dają one odwzorowanie wiele do wielu między wyrażeniami językowymi i znaczeniami. Zadanie parafrazowania polega na rozpoznaniu, kiedy dwa teksty mają to samo znaczenie i stworzeniu podobnego lub krótszego tekstu, który przekazuje prawie te same informacje. Konsekwencje tekstowe są podobne, ale osłabiają związek, by być jednokierunkowy. Rozwiązania matematyczne służące ustalaniu wynikania tekstowego można oprzeć na właściwości kierunkowej tej relacji, dokonując porównania między niektórymi kierunkowymi podobieństwami zaangażowanych tekstów.

Podejścia

Konsekwencja tekstowa mierzy rozumienie języka naturalnego, ponieważ prosi o semantyczną interpretację tekstu i ze względu na swoją ogólność pozostaje aktywnym obszarem badań. Rozważano wiele podejść i udoskonaleń podejść, takich jak osadzanie słów , modele logiczne, modele graficzne, systemy reguł, skupianie się na kontekście i uczenie maszynowe. Praktyczne lub wielkoskalowe rozwiązania unikają tych skomplikowanych metod i zamiast tego używają tylko powierzchniowej składni lub relacji leksykalnych, ale są odpowiednio mniej dokładne. Jednak nawet najnowocześniejsze systemy są nadal dalekie od ludzkich możliwości; badanie wykazało, że ludzie są zgodni co do zbioru danych w 95,25% przypadków, podczas gdy algorytmy z 2016 r. nie osiągnęły jeszcze 90%.

Aplikacje

Wiele aplikacji przetwarzania języka naturalnego, jak odpowiedzi na pytanie , ekstrakcji informacji , podsumowaniu , multi-dokument podsumowaniu i ocenie tłumaczenia maszynowego systemów, potrzeba uznania, że dany cel znaczenie można wywnioskować z wariantów inny tekst. Zwykle wynikanie jest używane jako część większego systemu, na przykład w systemie predykcji w celu odfiltrowania trywialnych lub oczywistych przewidywań.

Zobacz też

Bibliografia

  1. ^ Ido Dagan, Oren Glickman i Bernardo Magnini. PASCAL Recognizing Textual Entailment Challenge, s. 2 w: Quiñonero-Candela, J .; Dagan, I .; Magnini, B .; d'Alché-Buc, F. (red.) Wyzwania uczenia maszynowego. Notatki z wykładów z informatyki , tom. 3944, s. 177–190, Springer, 2006.
  2. ^ Korman, Daniel Z .; Mack, Eric; Jett, Jacob; Renear, Allen H. (09.03.2018). „Definiowanie skutku tekstowego” . Journal of the Association for Information Science and Technology . 69 (6): 763–772. doi : 10.1002 / asi.24007 . ISSN   2330-1635 .
  3. ^ a b Dagan, I. i O. Glickman. „Probabilistyczna konsekwencja tekstowa: ogólne stosowane modelowanie zmienności języka” w: PASCAL Workshop on Learning Methods for Text Understanding and Mining (2004) Grenoble.
  4. ^ a b Tătar, D. ea Textual Entailment as a Directional Relation
  5. ^ Portal o charakterze tekstowym na wiki Stowarzyszenia Lingwistyki Obliczeniowej
  6. ^ a b Androutsopoulos, Ion; Malakasiotis, Prodromos (2010). „Przegląd metod parafrazowania i wprowadzania tekstu” (PDF) . Journal of Artificial Intelligence Research . 38 : 135–187. arXiv : 0912.3747 . doi : 10.1613 / jair.2985 . Źródło 13 lutego wykupu w 2017 r . CS1 maint: zniechęcony parametr ( link )
  7. ^ Bos, Johan; Markert, Katja (1 stycznia 2005). „Rozpoznawanie uwarunkowań tekstowych na podstawie wnioskowania logicznego” (PDF) . Materiały z konferencji nt. Technologii języka ludzkiego i metod empirycznych w przetwarzaniu języka naturalnego : 628–635. doi : 10.3115 / 1220575.1220654 . Zarchiwizowane od oryginalnego (PDF) w dniu 13 lutego 2017 r . Źródło 13 lutego wykupu w 2017 r . CS1 maint: zniechęcony parametr ( link )
  8. ^ Zhao, Kai; Huang, Liang; Ma, Mingbo (4 stycznia 2017). „Tekstowe uwikłanie ze strukturalną uwagą i kompozycją”. arXiv : 1701.01126 [ cs.CL ].
  9. ^ Shani, Ayelett (25 października 2013). „Jak dr Kira Radinsky użył algorytmów do przewidywania zamieszek w Egipcie” . Haaretz . Źródło 13 lutego wykupu w 2017 r . CS1 maint: zniechęcony parametr ( link )

Linki zewnętrzne