Funkcja podobna do Haara - Haar-like feature

Haar-like cechy Digital Image funkcje stosowane w rozpoznawania obiektów . Swoją nazwę zawdzięczają intuicyjnemu podobieństwu do fal Haar i zostały użyte w pierwszym wykrywaczu twarzy w czasie rzeczywistym.

W przeszłości praca tylko z intensywnością obrazu (tj. Wartościami pikseli RGB dla każdego piksela obrazu) powodowała, że ​​obliczanie cech było kosztowne . Publikacja Papageorgiou et al. omówili pracę z alternatywnym zestawem funkcji opartym na falach Haara zamiast zwykłych intensywności obrazu. Paul Viola i Michael Jones zaadaptowali pomysł wykorzystania fal Haar i opracowali tak zwane funkcje podobne do Haar. Funkcja podobna do Haara bierze pod uwagę sąsiednie prostokątne obszary w określonym miejscu w oknie detekcji, podsumowuje intensywności pikseli w każdym regionie i oblicza różnicę między tymi sumami. Ta różnica jest następnie wykorzystywana do kategoryzowania podsekcji obrazu. Na przykład w przypadku ludzkiej twarzy często obserwuje się, że spośród wszystkich twarzy obszar oczu jest ciemniejszy niż obszar policzków. Dlatego powszechną funkcją Haara do wykrywania twarzy jest zestaw dwóch sąsiednich prostokątów, które znajdują się nad okiem i policzkiem. Położenie tych prostokątów jest definiowane w odniesieniu do okna wykrywania, które działa jak ramka ograniczająca obiekt docelowy (w tym przypadku twarz).

W fazie wykrywania struktury wykrywania obiektów Viola – Jones , okno o docelowym rozmiarze jest przesuwane nad obrazem wejściowym i dla każdej podsekcji obrazu obliczana jest cecha podobna do Haara. Ta różnica jest następnie porównywana z wyuczonym progiem, który oddziela obiekty niebędące obiektami od obiektów. Ponieważ taka cecha podobna do Haara jest tylko słabym uczniem lub klasyfikatorem (jej jakość wykrywania jest nieco lepsza niż przypadkowe zgadywanie), do opisania obiektu z wystarczającą dokładnością potrzebna jest duża liczba cech podobnych do Haara. W ramach wykrywania obiektów Violi – Jones cechy podobne do Haara są zatem zorganizowane w coś, co nazywa się kaskadą klasyfikatorów, tworząc silnego ucznia lub klasyfikator.

Główną zaletą funkcji podobnej do Haara nad większością innych funkcji jest szybkość obliczeń. Dzięki zastosowaniu integralnych obrazów , cecha podobna do Haara dowolnej wielkości może być obliczana w stałym czasie (około 60 instrukcji mikroprocesora dla funkcji 2-prostokątnej).

Prostokątne elementy przypominające Haar

Prostą prostokątną cechę podobną do Haara można zdefiniować jako różnicę w sumie pikseli obszarów wewnątrz prostokąta, które mogą znajdować się w dowolnym miejscu i skali w oryginalnym obrazie. Ten zmodyfikowany zestaw funkcji nosi nazwę operacji 2-prostokątnej . Viola i Jones zdefiniowali również funkcje 3-prostokątne i 4-prostokątne. Wartości wskazują na pewne cechy określonego obszaru obrazu. Każdy typ elementu może wskazywać na istnienie (lub brak) pewnych cech obrazu, takich jak krawędzie lub zmiany tekstury. Na przykład element składający się z dwóch prostokątów może wskazywać, gdzie leży granica między ciemnym a jasnym obszarem.

Szybkie obliczenia funkcji podobnych do Haar

Jednym z wkładów Violi i Jonesa było użycie tabel sumowanych powierzchni , które nazywali obrazami integralnymi . Obrazy integralne można zdefiniować jako dwuwymiarowe tabele przeglądowe w postaci macierzy o takim samym rozmiarze jak oryginalny obraz. Każdy element integralnego obrazu zawiera sumę wszystkich pikseli znajdujących się w lewym górnym obszarze oryginalnego obrazu (w odniesieniu do pozycji elementu). Pozwala to obliczyć sumę prostokątnych obszarów obrazu, w dowolnej pozycji lub skali, przy użyciu tylko czterech wyszukiwań:

Znajdowanie sumy zacieniowanego prostokątnego obszaru

gdzie punkty należą do integralnego obrazu , jak pokazano na rysunku.

Każda funkcja podobna do Haara może wymagać więcej niż czterech wyszukiwań, w zależności od tego, jak została zdefiniowana. Funkcje 2-prostokątów Violi i Jonesa wymagają sześciu odnośników, funkcje 3-prostokątów wymagają ośmiu odnośników, a funkcje 4-prostokątów wymagają dziewięciu odnośników.

Pochylone funkcje podobne do Haar

Lienhart i Maydt przedstawili koncepcję pochylonego (45 °) elementu podobnego do Haara. Zostało to wykorzystane w celu zwiększenia wymiarowości zestawu cech, próbując poprawić wykrywanie obiektów na obrazach. Udało się, ponieważ niektóre z tych cech są w stanie lepiej opisać obiekt. Na przykład, 2-prostokątny nachylony element podobny do Haara może wskazywać na istnienie krawędzi pod kątem 45 °.

Messom i Barczak rozszerzyli ten pomysł na ogólną obróconą funkcję podobną do Haara. Chociaż pomysł jest rozsądny z matematycznego punktu widzenia, praktyczne problemy uniemożliwiają użycie funkcji podobnych do Haara pod dowolnym kątem. Aby działać szybko, algorytmy detekcji wykorzystują obrazy o niskiej rozdzielczości, wprowadzając błędy zaokrągleń . Z tego powodu obracane elementy podobne do Haar nie są powszechnie używane.

Bibliografia

  1. ^ a b Viola i Jones, „ Szybkie wykrywanie obiektów przy użyciu wzmocnionej kaskady prostych funkcji ”, Computer Vision and Pattern Recognition , 2001
  2. ^ Papageorgiou, Oren i Poggio, „Ogólne ramy wykrywania obiektów”, Międzynarodowa konferencja na temat widzenia komputerowego, 1998.
  3. ^ Crow, F, „ Tablice zsumowanych obszarów do mapowania tekstur ”, w Proceedings of SIGGRAPH , 18 (3): 207–212, 1984
  4. ^ Lienhart, R. i Maydt, J., „ Rozszerzony zestaw funkcji podobnych do Haara do szybkiego wykrywania obiektów ”, ICIP02, s. I: 900–903, 2002
  5. ^ Messom, CH i Barczak, ALC, „ Fast and Efficient Rotated Haar-like Features Using Rotated Integral Images ”, Australian Conference on Robotics and Automation (ACRA2006), str. 1–6, 2006