Pary widmowe linii - Line spectral pairs

Liniowe pary widmowe ( LSP ) lub liniowe częstotliwości widmowe ( LSF ) są używane do reprezentowania współczynników predykcji liniowej (LPC) do transmisji przez kanał. LSP mają kilka właściwości (np. Mniejszą czułość na szum kwantyzacji), które czynią je lepszymi od bezpośredniej kwantyzacji LPC. Z tego powodu LSP są bardzo przydatne w kodowaniu mowy .

Reprezentacja LSP została opracowana przez Fumitadę Itakurę w Nippon Telegraph and Telephone (NTT) w 1975 roku. W latach 1975-1981 studiował problemy analizy i syntezy mowy w oparciu o metodę LSP. W 1980 roku jego zespół opracował chip syntezatora mowy oparty na LSP . LSP to ważna technologia syntezy i kodowania mowy, która w latach 90. XX wieku została przyjęta przez prawie wszystkie międzynarodowe standardy kodowania mowy jako niezbędny element, przyczyniając się do poprawy cyfrowej komunikacji głosowej w kanałach mobilnych i Internecie na całym świecie. LSP są wykorzystywane w algorytmie przewidywania liniowego wzbudzanego kodem (CELP), opracowanym przez Bishnu S. Atala i Manfreda R. Schroedera w 1985 r.

Podstawy matematyczne

Wielomian LP można wyrazić jako , gdzie:

Zgodnie z konstrukcją, P jest wielomianem palindromicznym, a Q - wielomianem antypalindromicznym ; Fizycznie P ( z ) odpowiada ścieżce głosowej z zamkniętą głośnią, a Q ( z ) z otwartą głośnią . Można wykazać, że:

Reprezentacja pary widmowej linii wielomianu LP składa się po prostu z lokalizacji pierwiastków P i Q (tj. Takiej, która ). Ponieważ występują w parach, tylko połowa rzeczywistych pierwiastków (zwykle między 0 a ) musi zostać przekazana. Całkowita liczba współczynników zarówno dla P, jak i Q jest zatem równa p , czyli liczbie oryginalnych współczynników LP (nie licząc ).

Typowym algorytmem znajdującym je polega na ocenie wielomianu w sekwencji blisko rozmieszczonych punktów wokół koła jednostkowego, obserwując, kiedy wynik zmienia znak; kiedy to robi, pierwiastek musi leżeć między testowanymi punktami. Ponieważ pierwiastki P są przeplatane z pierwiastkami Q, wystarczy jeden przebieg, aby znaleźć pierwiastki obu wielomianów.

Aby przekonwertować z powrotem na LPC, musimy oszacować przez „taktowanie” impulsu przechodzącego przez niego N razy (kolejność filtra), dając oryginalny filtr  A ( z ).

Nieruchomości

Pary widmowe linii mają kilka interesujących i użytecznych właściwości. Kiedy korzenie P ( z ) i Q ( z ) są przeplatane, stabilność filtra jest zapewniona wtedy i tylko wtedy, gdy korzenie rosną monotonicznie. Co więcej, im bliżej są dwa pierwiastki, tym bardziej rezonansowy jest filtr przy odpowiedniej częstotliwości. Ponieważ LSP nie są zbyt wrażliwe na szum kwantyzacji, a stabilność jest łatwo zapewniona, LSP są szeroko stosowane do kwantyzacji filtrów LPC. Częstotliwości widmowe linii można interpolować.

Zobacz też

Źródła

Zawiera przegląd dotyczący LPC.

  • Rozdział „Line Spectral Pairs” jako fragment online (pdf) / „Digital Signal Processing - A Computer Science Perspective” ( ISBN   0-471-29546-9 ) Jonathan Stein .

Bibliografia