Grupa zdjęć - Group of pictures

W kodowania wideo , a grupy obrazów lub struktury GOP określa kolejność wewnątrz- i klatkami są umieszczone. GOP to zbiór kolejnych obrazów w zakodowanym strumieniu wideo. Każdy zakodowany strumień wideo składa się z kolejnych GOP, z których generowane są widoczne ramki. Napotkanie nowego GOP w skompresowanym strumieniu wideo oznacza, że ​​dekoder nie potrzebuje żadnych poprzednich klatek do dekodowania następnych i umożliwia szybkie przeszukiwanie wideo.

Opis

Grupa GOP może zawierać następujące typy obrazów:

  • I picture lub I frame (obraz kodowany wewnętrznie, zwany również klatką kluczową lub i-ramką) – obraz, który jest kodowany niezależnie od wszystkich innych obrazów. Każdy GOP zaczyna się (w kolejności dekodowania) od tego typu obrazu.
  • Obraz P lub ramka P (obraz kodowany predykcyjnie) – zawiera informacje o różnicy z kompensacją ruchu w stosunku do wcześniej zdekodowanych obrazów. W starszych projektach, takich jak MPEG-1 , H.262 / MPEG-2 i H.263 , każdy obraz P może odwoływać się tylko do jednego obrazu, a obraz ten musi poprzedzać obraz P w kolejności wyświetlania oraz dekodowania i musi być obraz I lub P. Te ograniczenia nie mają zastosowania w nowszych standardach H.264/MPEG-4 AVC i HEVC .
  • Obraz B lub ramka B (obraz kodowany dwuprzewidywalnie) – zawiera informacje o różnicach z kompensacją ruchu w stosunku do wcześniej zdekodowanych obrazów. W starszych projektach, takich jak MPEG-1 i H.262/MPEG-2, każdy obraz B może odnosić się tylko do dwóch obrazów, tego, który poprzedza obraz B w kolejności wyświetlania i tego, który następuje po nim, a wszystkie przywoływane obrazy muszą być I lub P zdjęcia. Te ograniczenia nie mają zastosowania w nowszych standardach H.264/MPEG-4 AVC i HEVC .
  • Obraz D lub ramka D (obraz kodowany bezpośrednio DC) – służy jako reprezentacja obrazu o szybkim dostępie pod kątem odporności na utratę lub przewijania do przodu. Zdjęcia D są używane tylko w wideo MPEG-1 .

Ramka I wskazuje początek grupy GOP. Następnie następuje kilka ramek P i B. W starszych projektach dozwolona struktura porządkowania i odniesienia jest stosunkowo ograniczona.

Ramki I zawierają pełny obraz i nie wymagają żadnych dodatkowych informacji do ich rekonstrukcji. Zazwyczaj kodery używają struktur GOP, które powodują, że każda ramka I jest „czystym losowym punktem dostępu”, tak że dekodowanie może rozpocząć się czysto na ramce I, a wszelkie błędy w strukturze GOP są korygowane po przetworzeniu poprawnej ramki I.

W nowszych projektach znalezionych w H.264/MPEG-4 AVC i HEVC enkodery mają znacznie większą elastyczność w odniesieniu do struktur. Mogą korzystać z tych samych struktur referencyjnych, które były używane wcześniej w starszych projektach, lub mogą używać większej liczby obrazów jako odniesień i mogą stosować bardziej elastyczną kolejność kodowania w stosunku do kolejności wyświetlania. Mogą również używać obrazów B jako odniesień podczas kodowania innych obrazów (B lub P). Ta dodatkowa elastyczność może poprawić wydajność kompresji, ale może powodować propagację błędów w przypadku utraty lub uszkodzenia niektórych danych. Jedną z popularnych struktur do użytku z nowszymi projektami jest użycie hierarchii obrazów B. Hierarchiczne obrazy B mogą zapewnić bardzo dobrą wydajność kompresji, a także ograniczyć propagację błędów, ponieważ hierarchia może zapewnić, że liczba obrazów dotkniętych jakimkolwiek problemem z uszkodzeniem danych jest ściśle ograniczona.

Ogólnie rzecz biorąc, im więcej klatek ma strumień wideo, tym bardziej można go edytować. Jednak posiadanie większej liczby klatek I znacznie zwiększa przepływność potrzebną do kodowania wideo.

Struktura GOP

Struktura GOP jest często określana dwoma liczbami, na przykład M=3, N=12. Pierwsza liczba określa odległość między dwiema ramkami kotwiącymi (I lub P). Drugi określa odległość między dwoma pełnymi obrazami (ramkami I): ​​jest to rozmiar GOP. Na przykład M=3, N=12, struktura GOP to IBBPBBPBBPBBI. Zamiast parametru M można użyć maksymalnej liczby ramek B między dwiema kolejnymi ramkami zakotwiczenia.

Na przykład w sekwencji ze wzorem IBBBBPBBBBBBBBBBBI rozmiar GOP ( wartość N ) jest równy 15 (długość między dwiema ramkami I), a odległość między dwiema ramkami zakotwiczenia ( wartość M ) wynosi 5 (długość między ramkami I i P lub długość między ramkami dwie kolejne ramki P).

Bibliografia

  1. ^ „Klatki kluczowe, InterFrame i kompresja wideo” . 13 kwietnia 2021 r.
  2. ^ „B-ramki” .
  3. ^ "Instrukcja obsługi sprężarki 4" .