Maszyna mówiąca Wolfganga von Kempelena - Wolfgang von Kempelen's speaking machine

Replika maszyny mówiącej Kempelena, zbudowany 2007-09 na Wydziale fonetyki, Saarland University , Saarbrücken , Niemcy

Maszyna mówiąca Wolfganga von Kempelena to ręcznie obsługiwany syntezator mowy, którego rozwój rozpoczął się w 1769 roku przez austrowęgierskiego autora i wynalazcę Wolfganga von Kempelena . To właśnie w tym samym roku, ukończył naukę znacznie bardziej niesławny wkład do historii: Turka , a szachy -playing automat , a później okazuje się być bardzo daleko idące i skomplikowane oszustwo ze względu na szachowy ludzkie samopoczucie zajmując jego wnętrzności . [4] Ale podczas gdy budowa Turka została ukończona w ciągu sześciu miesięcy, maszyna mówiąca Kempelena zajęła następne dwadzieścia lat jego życia. [2] Po dwóch koncepcyjnych „ślepych uliczkach” w ciągu pierwszych pięciu lat badań, trzeci kierunek Kempelena ostatecznie doprowadził go do projektu, który czuł jako „ostateczny”: funkcjonalny model reprezentacji ludzkiego przewodu głosowego . [3]

Pierwszy projekt

Pierwszy eksperyment Kempelena z syntezą mowy obejmował tylko najbardziej prymitywne elementy drogi głosowej niezbędne do wytwarzania dźwięków podobnych do mowy. Miech kuchenny, używany do podsycania ognia w piecach opalanych drewnem, był wywoływany jako zestaw płuc dostarczający przepływ powietrza. Trzcina wyciągnięta ze zwykłej dudy została zaimplementowana jako głośnia , źródło surowego podstawowego dźwięku w przewodzie głosowym. Dzwon klarnetowy, mimo sztywnej formy, stworzył wystarczającą ustę. Ten podstawowy model był w stanie wytwarzać tylko proste dźwięki samogłoskowe, chociaż można było uzyskać pewną dodatkową artykulację, umieszczając dłoń na otworze dzwonu w celu utrudnienia przepływu powietrza. Fizyczne sprzętu do konstruowania spółgłosek nosowych , spółgłoski zwarte i spółgłoski frykcyjne, że większość spółgłosek wymagają nie był obecny, jednak. Kempelen, podobnie jak wielu innych wczesnych pionierów fonetyki , źle rozumiał źródło postrzeganych „wyższych częstotliwości” pewnych dźwięków jako funkcję głośni, a nie jako funkcję formantów całego traktu głosowego, więc porzucił swój pojedynczy konstrukcja trzciny dla podejścia wielokrotnego trzciny. [2] [3]

Drugi projekt

Drugi projekt obejmował konsolę, podobną do tej z organów muzycznych z tamtego okresu, w której operator obsługiwał zestaw klawiszy, po jednym na każdą literę. Dźwięki były wytwarzane przez wspólny miech, który doprowadzał powietrze przez różne rury o odpowiednich kształtach i przeszkodach potrzebnych do wydrukowania tej litery. Dzięki eksperymentom doszedł do wniosku, że rezonansowa długość trzciny nie była kluczowa dla tworzenia składowych o wysokiej częstotliwości niektórych samogłosek i frykatów, więc dostroił je wszystkie tak, aby miały tę samą wysokość, aby zachować spójność między literami. Chociaż nie wszystkie litery były w tym momencie reprezentowane, Kempelen opracował technologię wymaganą do tworzenia większości samogłosek i kilku spółgłosek, w tym głoski / p / i nosowej / m /, dzięki czemu był w stanie rozpocząć tworzenie sylab i krótkich. słowa. Jednak to natychmiast doprowadziło do głównej wady jego drugiego projektu: równoległy charakter wielu stroików pozwalał na wybrzmiewanie więcej niż jednej litery na raz. A w procesie budowania sylab i słów, dźwiękowe „nakładanie się” (obecnie określane jako współartykulacja ) sprawiało, że dźwięki były bardzo nietypowe dla ludzkiej mowy, całkowicie podważając intencję projektu. Kempelen komentuje:
„Aby móc kontynuować moje eksperymenty, potrzebowałem przede wszystkim doskonałej wiedzy na temat tego, co chcę naśladować. Musiałem przeprowadzić formalne studium mowy i nieustannie konsultować się z naturą podczas przeprowadzania eksperymentów. W ten sposób moja mówiąca maszyna i moja teoria dotycząca mowy zrobiły równe postępy, a jedna służyła jako przewodnik dla drugiej ”. [3]
„Można było, stosując metody, które stosowałem, wymyślić oddzielne litery, ale nigdy nie łączyć ich w sylaby, i że było absolutnie konieczne podążanie za naturą, która ma tylko jedną głośnię i jedne usta, poprzez który wydobywa się z każdego dźwięku i który nadaje im jedność. " [2] [3]
W ten sposób Kempelen rozpoczął pracę nad swoim trzecim i ostatecznie ostatecznym projektem, który sam w sobie był pod wieloma względami „możliwie najbardziej zbliżony” do fizjologii przewodu głosowego.

Trzeci projekt

Trzecie podejście było podobne do pierwszego, które było koncepcyjnie bardziej wierne naturalnemu projektowi ludzkiego układu głosowego niż drugie. Składał się, jak poprzednio, z miecha, trzciny i symulowanych ust (tym razem wykonanych z indyjskiej gumy , dla lepszego tworzenia dźwięków samogłosek przez ręczną manipulację), ale zawierał także „gardło”, do którego „jama nosowa” został dołączony (w komplecie z dwoma "nozdrzami" do wymawiania spółgłosek nosowych), a także kilka dźwigni i rurek przeznaczonych do wymawiania / s / i / ʃ /, pręt, który zakłócałby wibracje trzciny w celu artykulacji / r / i oddzielania , mniejsze miechy, które umożliwiałyby przepływ powietrza przez trzcinę, gdy pysk był całkowicie zamknięty (cecha wymagana do wymawiania / b /). W pewnym momencie dołączono specjalny zawór, który miał symulować / f /, ale został później usunięty, gdy okazało się, że ten sam dźwięk można uzyskać, po prostu zamykając wszystkie otwory maszyny i umożliwiając wyciek powietrza z pęknięć. Podobnie w pewnym momencie projektu istniał alternatywny zespół „ust” składający się z drewnianego pudełka z parą zawiasowych okiennic, które działały jak usta. Wewnątrz pudełka znajdowała się drewniana klapka na zawiasach, obsługiwana za pomocą sznurka, która działała jak język. Celem tego zespołu było naśladowanie ust i języka w konstrukcji materiałów wybuchowych, takich jak „b” i „d”, ale zostało później usunięte, gdy Kempelen stwierdził, że bez odpowiedniego języka maszyna nigdy nie byłaby w stanie wyprodukować / t /, / d /, / k / i / ɡ /. Znalazł sposób na obejście tego całego problemu, zastępując / t / i / k / z / p /, i / d / i / ɡ / z / b / (co samo w sobie różniło się tylko dźwięcznością od / p /). W kontekście znanego słowa, słuchacze często całkowicie ignorowali błędną wymowę (zjawisko badane później przez badaczy kognitywistyki ). Kempelen uważał, że ludzie lepiej wybaczają błędy popełniane przez jego maszynę ze względu na częstotliwość rezonansu trzciny i przewodu głosowego, które wybrał, co powoduje rezonans bardziej podobny do rezonansu małego dziecka niż dorosłego. [2] [3] Ten trzeci projekt, w przeciwieństwie do poprzednich, był w pełni zdolny do mówienia pełnych fraz w języku francuskim, włoskim i angielskim (niemiecki był możliwy, ale wymagał od operatora wyższego poziomu umiejętności, ze względu na częstsze używanie spółgłosek w języku niemieckim). Jego największym ograniczeniem były miechy, które chociaż miały pojemność sześciokrotnie większą niż ludzkie płuca, opróżniały się znacznie szybciej niż jego ludzki odpowiednik. Ponieważ projekt opierał się na pojedynczej trzcinie jako głośniowym źródle dźwięku, nie miał żadnych problemów z ko-artykulacją, które były nieodłącznie związane z drugim projektem. Ale ten pojedynczy stroik oznaczał również, że Mówiąca Maszyna miała monotonny głos. [4] Kempelen poświęcił trochę czasu na próbę wprowadzenia kilku prozodycznych mechanizmów zmiany wysokości tonu do zespołu trzciny, ale bezskutecznie. Postanowił pozostawić projekt do ulepszenia przez następną grupę eksperymentatorów. Wszystkie te ważne dodatki do trzeciego projektu pochodzą z dwóch dziesięcioleci intensywnych badań układu głosowego w odniesieniu do języków mówionych przez Kempelena, dla których zachowanie każdego kluczowego fizjologicznego elementu produkcji mowy zostało dokładnie przeanalizowane i odtworzone akustycznie i / lub mechanicznie. . [3]

Znaczący wkład

Wkrótce po ukończeniu i wystawieniu swojej Mówiącej Maszyny, w 1804 roku, von Kempelen zmarł, choć nie wcześniej niż opublikował niezwykle obszerny dziennik z ostatnich dwudziestu lat jego badań nad fonetyką. 456-stronicowa książka, zatytułowana Mechanismus der menschlichen Sprache nebst Beschreibung einer sprechenden Maschine (co tłumaczy się na The Mechanism of Human Speech, with a Description of a Speaking Machine , opublikowana w 1791) [2] [4] , zawierała wszystkie techniczne aspekty zarówno konstrukcję Mówiącej Maszyny Kempelena (w tym wstępne projekty), jak i jego badania nad ludzkim przewodem głosowym. [3]

W 1837 roku Sir Charles Wheatstone wskrzesił dzieło Wolfganga von Kempelena, tworząc ulepszoną replikę swojej Mówiącej Maszyny. [3] [4] Korzystając z nowej technologii opracowanej w ciągu ostatnich 50 lat, Wheatstone był w stanie dalej analizować i syntetyzować składniki mowy akustycznej, co dało początek drugiej fali naukowych zainteresowań fonetyką. Po obejrzeniu ulepszonej repliki Mówiącej Maszyny Wheatstone'a na wystawie, młody Alexander Graham Bell , z pomocą i zachętą swojego ojca, postanowił skonstruować własną maszynę mówiącą. [4] [5] Eksperymenty i badania Bella ostatecznie doprowadziły do ​​jego wynalezienia telefonu w 1876 r. [4] , który zrewolucjonizował globalną komunikację.

W 1968 roku Marcel Van den Broecke (Uniwersytet Amsterdamski) zbudował replikę w ramach pracy magisterskiej, o której pisał w „Strukturach dźwięku”, Marcel van den Broecke, Vincent van Heuven i Wim Zonneveld (red.), Rozdział 2 , s. 9-19: „Wolfgang von Kempelen's Speaking Machine as a Performer”, Foris Publications, Dordrecht-Netherlands / Cinnaminson-USA, 1983. Prognozy akustyczne wykorzystujące aproksymacje kanału głosowego z tubą N i zastosowanie ich do cech repliki pokazały, co zostało już ustalone percepcyjnie, a mianowicie, że maszyna może wytwarzać tylko dwa dźwięki podobne do samogłosek, a mianowicie. samogłoska podobna do / a / i samogłoska podobna do / o /. Spośród wyprodukowanych spółgłosek bardzo przekonywujący jest materiał wybuchowy ogólnego przeznaczenia. Można również łatwo zidentyfikować nos ogólnego przeznaczenia, ale sybilanty i grzechotanie / r / są tak nieprzyjemne, jak naoczny świadek von Windisch relacjonował dwa wieki wcześniej.

Bibliografia

  1. Von Kempelen, Wolfgang, Mechanismus Der Menschlichen Sprache Nebst Beschreibung Seiner Sprechenden Maschine , Austria: Stuttgart-Bad Cannstatt, 1970.
  2. Wolfgang von Kempelen: Der Mechanismus der menschlichen Sprache. / Mechanizm ludzkiej mowy. : Transliteracja Kommentierte & Übertragung ins Englische / Transliteracja z komentarzami i tłumaczenie na język angielski. Herausgegeben von / pod redakcją Fabiana Brackhane'a, Richarda Sproata i Jürgena Trouvaina; Drezno 2017 ( wersja online ).
  3. Dudley, Homer & Tarnoczy, TH, Mówiąca maszyna Wolfganga Von Kempelena. The Journal of the Acoustical Society of America , tom 22, nr 2, marzec 1950: s. 151–166.
  4. Linggard, R., Electronic Synthesis of Speech , Cambridge: Cambridge University Press , 1985: str. 4–9
  5. Standage, Tom, The Turk: The Life and Times of the Famous 18th-Century Chess-Playing Machine , New York: Walker & Company , 2002: str. 76–81
  6. Rossing, Thomas i in., The Science of Sound , San Francisco: Addison-Wesley , 2002: str. 365

Linki zewnętrzne