Generatywna mapa topograficzna - Generative topographic map

Generatywna mapa topograficzna ( GTM ) jest uczenie maszynowe metoda, która jest probabilistyczny odpowiednikiem samoorganizujących się map (SOM), jest prawdopodobnie zbieżne i nie wymaga kurczenia okolicę lub zmniejszającą wielkość skoku. Jest generatywne wzór : Dane zakłada powstają najpierw probabilistycznie wybranie punktu w małej przestrzeni trójwymiarowej, odwzorowanie punktu na obserwowanej powierzchni wysokiej wymiarowe wejściowego (poprzez niezawodnego działania), a następnie dodanie szumu w tej przestrzeni. Parametry niskowymiarowa rozkładu prawdopodobieństwa, gładkiej mapie i hałas są wyciągnięte z danych szkoleniowych wykorzystujących oczekiwanie-maksymalizacja algorytm (EM). GTM został wprowadzony w 1996 roku w dokumencie przez Krzysztofa Biskupa , Markus Svensen i Christopher KI Williams.

Szczegóły algorytmu

Podejście jest silnie związane z sieci gęstości których wykorzystuje próbkowanie znaczenie i perceptronowa wielowarstwowa tworząc nieliniowego modelu zmiennej utajonego . W GTM utajone miejsce jest dyskretnym siatkę punktów, które przyjmuje się nieliniowo rzutowany w przestrzeni danych. Szumu gaussowskiego założenie jest następnie w przestrzeni danych tak, że model zostaje ograniczone mieszaninę Gaussians . Wtedy prawdopodobieństwo modelki można zmaksymalizować przez EM.

Teoretycznie można stosować dowolną nieliniowa deformacja parametryczne. Optymalne parametry można znaleźć poprzez zejście gradientu, etc.

Proponowane podejście do nieliniowego mapowania jest użycie sieć radialna (RBF), aby utworzyć odwzorowanie pomiędzy nieliniowej utajonego miejsca i rozmiaru danych. Węzły sieci RBF tworzą wtedy przestrzeń nieliniowej funkcji mapowania i mogą być traktowane jako liniowy przekształcenia tej przestrzeni funkcji. Podejście to ma tę przewagę nad sugerowanego podejścia sieciowego gęstości, który może być zoptymalizowany analitycznie.

zastosowania

W analizie danych GTMs są jak nieliniowej wersji głównej analizy składników , co pozwala na szybkie dane wymiarowe być modelowane jako wynik gaussowski szum dodany do źródła w dolnym wymiarowej utajonego miejsca. Na przykład, aby zlokalizować zapasów w plottable przestrzeni 2D na podstawie ich kształtów hi-D szeregów czasowych. Inne aplikacje mogą chcieć mieć mniej punktów niż źródła danych, na przykład modeli mieszaniny.

W generatywnej modelowania deformacji utajony i danych przestrzenie mają te same wymiary, na przykład obrazów 2D lub 1 dźwiękowe fale dźwiękowe. Dodatkowe wymiary „pusty” są dodawane do źródła (znane jako „matrycy”, w tej postaci modelowania), na przykład lokalizowania się fali dźwiękowej 1D w przestrzeni 2D. Dalsze wymiary nieliniowe Następnie dodaje się, wytwarzane przez połączenie pierwotnych wymiarów. Powiększony utajonego miejsca następnie rzutowany z powrotem do przestrzeni danych 1D. Prawdopodobieństwo danym rzucie jest, jak poprzednio, daje iloczyn prawdopodobieństwa danych na podstawie modelu szumu gaussowskiego z przed parametru odkształcania. W przeciwieństwie do konwencjonalnych opartych na odkształcenia sprężyny modelowania, ma to tę zaletę, że jest analitycznie podlegających optymalizacji. Wadą jest to, że to podejście „wyszukiwania danych”, to znaczy kształtu przed odkształceniem jest mało prawdopodobne, aby mieć znaczenie jako objaśnienie możliwych odkształceń, ponieważ opiera się na bardzo wysokim artificial- i dowolnie wykonana nieliniowej utajonym przestrzeń. Z tego powodu przed uczy się od danych zamiast stworzonych przez człowieka eksperta, jak jest to możliwe w przypadku modeli opartych na wiosnę.

Porównanie z samoorganizujących map Kohonena

Natomiast węzły w samoorganizujących się map (SOM) mogą wędrować do woli, węzły GTM są ograniczane przez dopuszczalnych przekształceń i ich prawdopodobieństwa. Jeśli odkształcenia są grzeczne topologia utajonego przestrzeń jest zachowana.

SOM został stworzony jako biologicznego modelu neuronów i jest algorytm heurystyczny. Natomiast GTM nie ma nic wspólnego z neurologii lub poznania i jest probabilistycznie pryncypialne modelu. Tak, to ma wiele zalet w porównaniu z SOM, a mianowicie:

  • to wyraźnie formułuje model gęstości nad danymi.
  • korzysta z funkcji kosztu, który określa, jak dobrze że mapa jest szkolony.
  • wykorzystuje procedury optymalizacji dźwięku ( EM algorytm).

GTM został wprowadzony przez biskupa, Svensen i Williams w swoim Raporcie Technicznym w 1997 (Technical Zgłoś NCRG / 96/015, Aston University, Wielka Brytania) opublikowane później w Neural obliczeń. Została ona również opisana w doktorskiej tezy Markus Svensen (Aston, 1998).

Aplikacje

Zobacz też

Linki zewnętrzne