Zapytanie internetowe — Web query

Zapytań internetowych lub stron internetowych wyszukiwane jest kwerenda, że użytkownik wpisze w wyszukiwarce internetowej , aby zaspokoić ich potrzeby informacyjne . Zapytania wyszukiwania w sieci Web wyróżniają się tym, że często mają postać zwykłego tekstu, a dyrektywy wyszukiwania wartości logicznych są rzadko używane. Różnią się znacznie od standardowych języków zapytań , które podlegają ścisłym regułom składni jako języki poleceń ze słowami kluczowymi lub parametrami pozycyjnymi .

Rodzaje

Istnieją trzy ogólne kategorie, które obejmują większość zapytań w sieci: informacyjne, nawigacyjne i transakcyjne. Są one również nazywane „zrób, wiedz, idź”. Chociaż ten model wyszukiwania nie został wyprowadzony teoretycznie, klasyfikacja została zweryfikowana empirycznie na podstawie rzeczywistych zapytań wyszukiwarek.

  • Zapytania informacyjne — zapytania dotyczące szerokiego tematu (np. kolorado lub ciężarówki ), dla których mogą istnieć tysiące trafnych wyników.
  • Zapytania nawigacyjne — zapytania, które prowadzą do jednej witryny lub strony internetowej jednego podmiotu (np. youtube lub linie lotnicze delta ).
  • Zapytania transakcyjne — zapytania, które odzwierciedlają zamiar użytkownika, aby wykonać określoną czynność, na przykład zakup samochodu lub pobranie wygaszacza ekranu.

Wyszukiwarki często obsługują czwarty typ zapytania, który jest używany znacznie rzadziej:

  • Zapytania o łączność — zapytania, które raportują o łączności zindeksowanego wykresu internetowego (np. które linki wskazują na ten adres URL ? i ile stron jest indeksowanych z tej nazwy domeny ?).

Charakterystyka

Lista sugestii wyszukiwania dla zapytania wyszukiwania

Większość komercyjnych wyszukiwarek internetowych nie ujawnia swoich dzienników wyszukiwania, więc trudno jest uzyskać informacje o tym, czego użytkownicy szukają w sieci. Niemniej jednak badania naukowe zaczęły pojawiać się w 1998 roku. Badanie z 2001 roku, w którym analizowano zapytania z wyszukiwarki Excite , wykazało kilka interesujących cech wyszukiwań internetowych:

  • Średnia długość zapytania wynosiła 2,4 hasła.
  • Około połowa użytkowników wprowadziła jedno zapytanie, podczas gdy nieco mniej niż jedna trzecia użytkowników wprowadziła trzy lub więcej unikalnych zapytań.
  • Blisko połowa użytkowników sprawdziła tylko pierwszą lub dwie strony wyników (10 wyników na stronę).
  • Mniej niż 5% użytkowników korzystało z zaawansowanych funkcji wyszukiwania (np. operatorów logicznych, takich jak AND, OR i NOT).
  • Cztery najczęściej używane terminy to (puste wyszukiwanie) oraz of i sex.

Badanie tych samych dzienników zapytań Excite wykazało, że 19% zapytań zawierało termin geograficzny (np. nazwy miejsc, kody pocztowe, cechy geograficzne itp.).

Badania pokazują również, że oprócz krótkich zapytań (zapytań z kilkoma hasłami) istnieją przewidywalne wzorce tego, jak użytkownicy zmieniają swoje zapytania.

Badanie dzienników zapytań Yahoo z 2005 r. wykazało, że 33% zapytań od tych samych użytkowników to powtarzające się zapytania, a w 87% przypadków użytkownik kliknąłby ten sam wynik. Sugeruje to, że wielu użytkowników używa powtarzających się zapytań do ponownego odwiedzania lub ponownego znajdowania informacji. Analizę tę potwierdza post na blogu wyszukiwarki Bing, w którym stwierdzono, że około 30% zapytań to zapytania nawigacyjne.

Ponadto badania wykazały, że rozkłady częstotliwości w zapytaniu są zgodne z prawem potęgowym lub krzywymi rozkładu długiego ogona . Oznacza to, że najczęściej używana jest niewielka część terminów obserwowanych w dużym dzienniku zapytań (np. > 100 milionów zapytań), podczas gdy pozostałe terminy są używane rzadziej pojedynczo. Ten przykład zasady Pareto (lub reguły 80–20 ) umożliwia wyszukiwarkom stosowanie technik optymalizacji, takich jak partycjonowanie indeksu lub bazy danych , buforowanie i pobieranie z wyprzedzeniem. Ponadto przeprowadzono badania nad atrybutami zorientowanymi lingwistycznie, które mogą rozpoznać, czy zapytanie internetowe ma charakter nawigacyjny, informacyjny czy transakcyjny.

Badanie z 2011 r. wykazało, że średnia długość zapytań stale rosła w czasie, a średnia długość zapytań w języku innym niż angielski wzrosła bardziej niż w przypadku zapytań w języku angielskim. Google wdrożyło aktualizację kolibra w sierpniu 2013 r., aby obsłużyć dłuższe zapytania wyszukiwania, ponieważ więcej wyszukiwań ma charakter konwersacyjny (np. „gdzie jest najbliższa kawiarnia?”).

Zapytania strukturalne

Dzięki wyszukiwarkom obsługującym operatory logiczne i nawiasy można zastosować technikę tradycyjnie stosowaną przez bibliotekarzy. Użytkownik, który poszukuje dokumentów obejmujących kilka tematów lub aspektów, może chcieć opisać każdy z nich przez alternatywę charakterystycznych słów, takich jak vehicles OR cars OR automobiles. Aspektach zapytanie jest połączenie tych ścianek; np. zapytanie, które (electronic OR computerized OR DRE) AND (voting OR elections OR election OR balloting OR electoral)może znaleźć dokumenty dotyczące głosowania elektronicznego, nawet jeśli pomija jedno ze słów „elektroniczny” lub „głosowanie”, a nawet oba.

Zobacz też

Bibliografia