Transfer nauki - Transfer learning

Transfer learning (TL) to problem badawczy w uczeniu maszynowym (ML), który koncentruje się na przechowywaniu wiedzy zdobytej podczas rozwiązywania jednego problemu i zastosowaniu jej do innego, ale powiązanego problemu. Na przykład wiedza zdobyta podczas nauki rozpoznawania samochodów może mieć zastosowanie przy próbie rozpoznawania ciężarówek. Ten obszar badań ma pewien związek z długą historią literatury psychologicznej dotyczącej transferu uczenia się , chociaż praktyczne powiązania między tymi dwoma obszarami są ograniczone. Z praktycznego punktu widzenia ponowne wykorzystanie lub przenoszenie informacji z wcześniej nauczonych zadań w celu uczenia się nowych zadań może znacznie poprawić wydajność próbki agenta wzmacniającego uczenie się .

Historia

W 1976 roku Stevo Bozinovski i Ante Fulgosi opublikowali artykuł wyraźnie poświęcony uczeniu transferu w treningu sieci neuronowych. W artykule przedstawiono matematyczno-geometryczny model uczenia transferowego. W 1981 r. przedstawiono raport dotyczący zastosowania uczenia transferowego w trenowaniu sieci neuronowej na zbiorze danych obrazów przedstawiających litery terminali komputerowych. Eksperymentalnie zademonstrowano zarówno pozytywne, jak i negatywne uczenie się transferu.

W 1993 roku Lorien Pratt opublikował artykuł na temat transferu w uczeniu maszynowym , formułując algorytm transferu opartego na dyskryminacji (DBT).

W 1997 r. goście Pratt i Sebastian Thrun zredagowali specjalne wydanie Machine Learning poświęcone uczeniu transferowemu, a do 1998 r. dziedzina ta poszerzyła się o uczenie wielozadaniowe wraz z bardziej formalną analizą jego teoretycznych podstaw. Nauka uczenia się , pod redakcją Thruna i Pratta, jest przeglądem tego tematu z 1998 roku.

Transfer learning został również zastosowany w kognitywistyce , a Pratt również gościnnie redagował wydanie Connection Science na temat ponownego wykorzystania sieci neuronowych poprzez transfer w 1996 roku.

Andrew Ng powiedział w swoim samouczku NIPS 2016, że TL będzie kolejnym motorem sukcesu komercyjnego ML po nadzorowanym uczeniu się, aby podkreślić znaczenie TL.

Definicja

Definicja uczenia się transferowego podana jest w kategoriach domen i zadań. Dziedzina składa się z: przestrzeni cech i marginalnego rozkładu prawdopodobieństwa , gdzie . Zadanie dla określonej domeny składa się z dwóch komponentów: obszaru etykiet i obiektywnej funkcji predykcyjnej . Funkcja służy do przewidywania odpowiedniej etykiety nowej instancji . Zadanie to, oznaczone , jest wyuczone z danych treningowych składających się z par , gdzie i . ${\mathcal {D}}$ ${\mathcal {X}}$ ${\ Displaystyle P (X)}$ ${\ Displaystyle X = \ {x_ {1}, ..., x_ {n} \} \ w {\ mathcal {X}}}$ ${\ Displaystyle {\ mathcal {D}} = \ {{\ mathcal {X}}, P (X) \}}$ ${\mathcal {Y}}$ $f:{\mathcal {X}}\rightarrow {\mathcal {Y}}$ $f$ $f(x)$ $x$ ${\ Displaystyle {\ mathcal {T}} = \ {{\ mathcal {Y}}, f (x) \}}$ ${\ Displaystyle \ {x_ {i}, y_ {i} \}}$ ${\ Displaystyle X_ {i} \ w X}$ ${\ Displaystyle y_ {i} \ w {\ matematyczny {Y}}}$

Biorąc pod uwagę domenę źródłową i zadania nauki , domenę docelową i zadanie uczenia się , gdzie , lub , cele uczenia przelew, aby poprawić uczenie funkcji predykcyjnej docelowej w użyciu wiedzy i . ${\ Displaystyle {\ Mathcal {D}} _ {S}}$ ${\ Displaystyle {\ Mathcal {T}} _ {S}}$ ${\ Displaystyle {\ Mathcal {D}} _ {T}}$ ${\ Displaystyle {\ Mathcal {T}} _ {T}}$ ${\ Displaystyle {\ mathcal {D}} _ {S} \ neq {\ mathcal {D}} _ {T}}$ ${\ Displaystyle {\ mathcal {T}} _ {S} \ neq {\ mathcal {T}} _ {T}}$ ${\ Displaystyle f_ {T} (\ cdot )}$ ${\ Displaystyle {\ Mathcal {D}} _ {T}}$ ${\ Displaystyle {\ Mathcal {D}} _ {S}}$ ${\ Displaystyle {\ Mathcal {T}} _ {S}}$

Aplikacje

Dostępne są algorytmy uczenia transferu w sieciach logicznych Markowa i sieciach bayesowskich . Uczenie transferowe zostało również zastosowane do wykrywania podtypów raka, wykorzystania budynków , ogólnej gry w gry , klasyfikacji tekstu , rozpoznawania cyfr, obrazowania medycznego i filtrowania spamu .

W 2020 r. odkryto, że ze względu na ich podobny charakter fizyczny, możliwe jest uczenie transferu między sygnałami elektromiograficznymi (EMG) z mięśni podczas klasyfikowania zachowań fal mózgowych elektroencefalograficznych (EEG) z domeny rozpoznawania gestów do domeny rozpoznawania stanów psychicznych. Zauważono również, że ta zależność działa na odwrót, pokazując, że EEG można również wykorzystać do dodatkowej klasyfikacji EMG. Eksperymenty wykazały, że dokładność sieci neuronowych i splotowych sieci neuronowych została poprawiona poprzez uczenie transferowe zarówno w pierwszej epoce (przed dowolnym uczeniem, tj. w porównaniu ze standardowym losowym rozkładem wag), jak i na asymptocie (koniec procesu uczenia). . Oznacza to, że algorytmy są ulepszane przez ekspozycję na inną domenę. Co więcej, użytkownik końcowy wstępnie wytrenowanego modelu może zmienić strukturę w pełni połączonych warstw, aby osiągnąć najwyższą wydajność.

Zobacz też

Bibliografia

Źródła

Thrun, Sebastianie; Pratt, Lorien (6 grudnia 2012). Nauka uczenia się . Springer Media o nauce i biznesie. Numer ISBN 978-1-4615-5529-2.

Languages

In other projects