Wielkie Wyzwanie Rozpoznawania Twarzy - Face Recognition Grand Challenge

Konkurs Face Recognition Grand Challenge (FRGC) został przeprowadzony w celu promowania i rozwijania technologii rozpoznawania twarzy . Był następcą testu Face Recognition Vendor Test .

Przegląd

Głównym celem FRGC było promowanie i rozwijanie technologii rozpoznawania twarzy zaprojektowanej w celu wspierania istniejących wysiłków w zakresie rozpoznawania twarzy w rządzie USA. FRGC opracowała nowe techniki rozpoznawania twarzy i systemy prototypowe, jednocześnie zwiększając wydajność o rząd wielkości. FRGC była otwarta na uznanie naukowców i programistów w firmach, środowiskach akademickich i instytucjach badawczych. FRGC trwał od maja 2004 do marca 2006.

FRGC składał się z coraz trudniejszych problemów wyzwań. Każdy problem związany z wyzwaniem składał się z zestawu danych obrazów twarzy i określonego zestawu eksperymentów. Jedną z przeszkód w rozwoju ulepszonego rozpoznawania twarzy jest brak danych. Problemy z wyzwaniem FRGC obejmują wystarczające dane, aby przezwyciężyć tę przeszkodę. Zestaw zdefiniowanych eksperymentów pomaga naukowcom i programistom w osiąganiu postępów w osiąganiu nowych celów wydajnościowych.

Istnieją trzy główne pretendenty do ulepszenia algorytmów rozpoznawania twarzy: obrazy o wysokiej rozdzielczości, trójwymiarowe (3D) rozpoznawanie twarzy i nowe techniki przetwarzania wstępnego. FRGC jednocześnie prowadzi i oceni zalety wszystkich trzech technik. Obecne systemy rozpoznawania twarzy są zaprojektowane do pracy ze stosunkowo małymi nieruchomymi obrazami twarzy. Tradycyjną metodą mierzenia wielkości twarzy jest liczba pikseli między środkami oczu. Na aktualnych zdjęciach między środkami oczu jest od 40 do 60 pikseli (10 000 do 20 000 pikseli na twarzy). W FRGC obrazy o wysokiej rozdzielczości składają się z obrazów twarzy o średniej wielkości 250 pikseli między środkami oczu. FRGC ułatwi opracowywanie nowych algorytmów wykorzystujących dodatkowe informacje nieodłącznie związane z obrazami o wysokiej rozdzielczości.

Trójwymiarowe (3D) algorytmy rozpoznawania twarzy identyfikują twarze na podstawie trójwymiarowego kształtu twarzy osoby. W obecnych systemach rozpoznawania twarzy zmiany oświetlenia ( iluminacji ) i ułożenia twarzy zmniejszają wydajność. Ponieważ na kształt twarzy nie mają wpływu zmiany oświetlenia ani pozy, rozpoznawanie twarzy 3D może poprawić wydajność w takich warunkach.

W ciągu ostatnich kilku lat nastąpił postęp w grafice komputerowej i wizji komputerowej w zakresie modelowania oświetlenia i zmian pozycji w obrazie twarzy. Postępy te doprowadziły do opracowania nowych algorytmów komputerowych, które mogą automatycznie korygować oświetlenie i zmiany ułożenia w obrazie twarzy. Te nowe algorytmy działają poprzez wstępne przetwarzanie obrazu twarzy w celu skorygowania oświetlenia i ułożenia przed przetworzeniem przez system rozpoznawania twarzy. Część FRGC dotycząca przetwarzania wstępnego zmierzy wpływ nowych algorytmów przetwarzania wstępnego na wydajność rozpoznawania.

FRGC poprawiła możliwości systemów automatycznego rozpoznawania twarzy poprzez eksperymentowanie z jasno określonymi celami i wyzwaniami. Badacze i programiści mogą opracowywać nowe algorytmy i systemy spełniające cele FRGC. Rozwój nowych algorytmów i systemów ułatwiają wyzwania FRGC.

Struktura Wielkiego Wyzwania Rozpoznawania Twarzy

FRGC jest skonstruowany wokół problemów, które mają na celu skłonienie naukowców do osiągnięcia celu dotyczącego wydajności FRGC.

Istnieją trzy aspekty FRGC, które będą nowe dla społeczności rozpoznawania twarzy. Pierwszym aspektem jest wielkość FRGC pod względem danych. Zbiór danych FRGC zawiera 50 000 nagrań. Drugi aspekt to złożoność FRGC. Poprzednie zestawy danych rozpoznawania twarzy były ograniczone do zdjęć. FRGC będzie składał się z trzech trybów:

obrazy nieruchome w wysokiej rozdzielczości
obrazy 3D
wiele obrazów osoby.

Trzecim nowym aspektem jest infrastruktura. Infrastruktura dla FRGC zostanie zapewniona przez Biometric Experimentation Environment (BEE), oparte na XML ramy do opisywania i dokumentowania eksperymentów obliczeniowych. BEE umożliwi opis i dystrybucję eksperymentów we wspólnym formacie, rejestrację nieprzetworzonych wyników eksperymentu we wspólnym formacie, analizę i prezentację nieprzetworzonych wyników we wspólnym formacie oraz dokumentację formatu eksperymentu we wspólnym formacie . Po raz pierwszy środowisko obliczeniowo-eksperymentalne pomogło w rozwiązaniu problemu z rozpoznawaniem twarzy lub biometrią.

Zbiór danych FRGC

Dystrybucja danych FRGC składa się z trzech części. Pierwszym z nich jest zestaw danych FRGC. Druga część to FRGC BEE. Rozkład BEE obejmuje wszystkie zestawy danych do wykonania i oceny sześciu eksperymentów. Trzecia część to zestaw podstawowych algorytmów dla eksperymentów od 1 do 4. We wszystkich trzech komponentach możliwe jest przeprowadzenie eksperymentów od 1 do 4, od przetwarzania nieprzetworzonych obrazów do tworzenia charakterystyk operacyjnych odbiornika (ROC).

Dane dla FRGC składają się z 50 000 nagrań podzielonych na partycje uczące i walidacyjne. Podział treningowy jest przeznaczony do uczenia algorytmów, a część walidacyjna służy do oceny wydajności podejścia w warunkach laboratoryjnych. Partycja walidacji składa się z danych z 4003 sesji tematycznych. Sesja tematyczna to zestaw wszystkich obrazów osoby wykonywanych za każdym razem, gdy zbierane są dane biometryczne danej osoby i składa się z czterech kontrolowanych nieruchomych obrazów, dwóch niekontrolowanych nieruchomych obrazów i jednego trójwymiarowego obrazu. Kontrolowane zdjęcia zostały wykonane w warunkach studyjnych, są to pełne przednie zdjęcia twarzy wykonane w dwóch warunkach oświetleniowych i z dwoma wyrazami twarzy (uśmiechniętym i neutralnym). Niekontrolowane zdjęcia zostały wykonane w różnych warunkach oświetleniowych; np. korytarze, atria lub na zewnątrz. Każdy zestaw niekontrolowanych obrazów zawiera dwa wyrazy twarzy, uśmiechnięty i neutralny. Obraz 3D został wykonany w kontrolowanych warunkach oświetlenia. Obrazy 3D składają się zarówno z zakresu, jak i obrazu tekstury. Obrazy 3D zostały pobrane za pomocą czujnika serii Minolta Vivid 900/910.

Rozkład FRGC składa się z sześciu eksperymentów. W eksperymencie 1 galeria składa się z jednego kontrolowanego nieruchomego obrazu osoby, a każda sonda składa się z jednego kontrolowanego nieruchomego obrazu. Eksperyment 1 jest eksperymentem kontrolnym. Eksperyment 2 bada wpływ używania wielu nieruchomych obrazów osoby na wydajność. W eksperymencie 2 każda próbka biometryczna składa się z czterech kontrolowanych obrazów osoby wykonanych podczas sesji przedmiotowej. Na przykład galeria składa się z czterech zdjęć każdej osoby, przy czym wszystkie zdjęcia zostały zrobione w tej samej sesji tematycznej. Podobnie sonda składa się teraz z czterech obrazów osoby.

Eksperyment 3 mierzy wydajność rozpoznawania twarzy 3D. W eksperymencie 3 galeria i zestaw sond składają się z obrazów 3D osoby. Eksperyment 4 mierzy wydajność rozpoznawania z niekontrolowanych obrazów. W eksperymencie 4 galeria składa się z jednego kontrolowanego nieruchomego obrazu, a zestaw sond składa się z jednego niekontrolowanego nieruchomego obrazu.

Eksperymenty 5 i 6 sprawdzają porównanie obrazów 3D i 2D. W obu eksperymentach galeria składa się z obrazów 3D. W eksperymencie 5 zestaw sond składa się z jednego kontrolowanego destylatora. W eksperymencie 6 zestaw sond składa się z jednego niekontrolowanego destylatora.

Sponsorzy

Bibliografia

Ten artykuł zawiera materiał z domeny publicznej z dokumentu Narodowego Instytutu Standardów i Technologii : „NIST Face Recognition Grand Challenge” .

Languages

In other projects