Obserwator państwowy - State observer

W teorii sterowania , A obserwator stan lub estymatorem stanu jest systemem, który zapewnia oszacowanie stanu wewnętrznego w danym systemie rzeczywistym, na podstawie pomiarów wejściu i wyjściu układu rzeczywistego. Jest typowo realizowany komputerowo i stanowi podstawę wielu praktycznych zastosowań.

Znajomość stanu systemu jest niezbędna do rozwiązania wielu problemów teorii sterowania ; na przykład stabilizowanie systemu za pomocą sprzężenia zwrotnego stanu . W większości praktycznych przypadków stan fizyczny układu nie może być określony przez bezpośrednią obserwację. Zamiast tego pośrednie skutki stanu wewnętrznego są obserwowane na wyjściach systemu. Prostym przykładem są pojazdy w tunelu: tempo i prędkości, z jakimi pojazdy wjeżdżają i wyjeżdżają z tunelu, można obserwować bezpośrednio, ale dokładny stan wewnątrz tunelu można jedynie oszacować. Jeżeli system jest obserwowalny , możliwe jest pełne zrekonstruowanie stanu systemu na podstawie jego pomiarów wyjściowych za pomocą obserwatora stanu.

Typowy model obserwatora

Schemat blokowy obserwatora Luenberger. Wejście wzmocnienia obserwatora L to .

Obserwatory liniowe, ślizgowe i sześcienne są jednymi z kilku struktur obserwatorów używanych do estymacji stanu układów liniowych. W kolejnych rozdziałach opisana jest liniowa struktura obserwatora.

Sprawa czasu dyskretnego

Zakłada się, że stan liniowego, niezmiennego w czasie fizycznego systemu dyskretnego jest spełniony

gdzie w czasie , to stan tego zakładu; jest jego wejściami; i jest jego wyjściami. Równania te mówią po prostu, że zarówno bieżące wyjścia elektrowni, jak i jej przyszły stan są określone wyłącznie przez jej bieżące stany i bieżące wejścia. (Chociaż równania te są wyrażone w postaci dyskretnych kroków czasowych, bardzo podobne równania obowiązują dla układów ciągłych ). Jeśli ten system jest obserwowalny, to wyjście zakładu, , może być wykorzystane do sterowania stanem obserwatora stanu.

Model obserwatora układu fizycznego jest wtedy zwykle wyprowadzany z powyższych równań. Dodatkowe warunki mogą być zawarte w celu zapewnienia, że ​​po otrzymaniu kolejnych zmierzonych wartości wejść i wyjść zakładu, stan modelu będzie zbieżny ze stanem zakładu. W szczególności wyjście obserwatora można odjąć od wyjścia rośliny, a następnie pomnożyć przez macierz ; jest on następnie dodawany do równań stanu obserwatora w celu wytworzenia tak zwanego obserwatora Luenbergera , zdefiniowanego poniższymi równaniami. Zauważ, że zmienne obserwatora stanu są zwykle oznaczane przez „czapkę”: i aby odróżnić je od zmiennych równań spełnianych przez układ fizyczny.

Obserwator jest nazywany asymptotycznie stabilnym, jeśli błąd obserwatora zbiega się do zera, gdy . Dla obserwatora Luenberger błąd obserwatora spełnia . Obserwator Luenbergera dla tego układu czasu dyskretnego jest zatem asymptotycznie stabilny, gdy macierz ma wszystkie wartości własne wewnątrz okręgu jednostkowego.

W celach kontrolnych wyjście systemu obserwatorów jest przesyłane z powrotem do wejścia zarówno obserwatora, jak i instalacji poprzez macierz wzmocnień .

Równania obserwatora stają się wtedy:

lub prościej

Dzięki zasadzie separacji wiemy, że możemy wybierać i samodzielnie bez szkody dla ogólnej stabilności systemów. Z reguły bieguny obserwatora są zwykle wybierane tak, aby zbiegały się 10 razy szybciej niż bieguny układu .

Przypadek ciągły

Poprzedni przykład dotyczył obserwatora zaimplementowanego w systemie LTI z czasem dyskretnym. Jednak proces jest podobny w przypadku czasu ciągłego; wzmocnienia obserwatora dobierane są tak, aby dynamika błędu ciągłego czasu asymptotycznie zbiegała się do zera (tj. kiedy jest macierzą Hurwitza ).

Dla systemu liniowego w czasie ciągłym

gdzie , obserwator wygląda podobnie do opisanego powyżej przypadku czasu dyskretnego:

.

Błąd obserwatora spełnia równanie

.

Wartości własne macierzy mogą być wybrane dowolnie przez odpowiedni dobór wzmocnienia obserwatora, gdy para jest obserwowalna, czyli warunek obserwowalności jest spełniony. W szczególności może być wykonany Hurwitz, więc błąd obserwatora przy .

Peaking i inne metody obserwatora

Gdy wzmocnienie obserwatora jest wysokie, liniowy obserwator Luenbergera bardzo szybko zbliża się do stanów układu. Jednak wysokie wzmocnienie obserwatora prowadzi do zjawiska szczytowego, w którym początkowy błąd estymatora może być zbyt duży (tj. niepraktyczny lub niebezpieczny w użyciu). W konsekwencji dostępne są nieliniowe metody obserwatora o dużym wzmocnieniu, które szybko zbiegają się bez zjawiska pików. Na przykład, sterowanie trybem ślizgowym może być wykorzystane do zaprojektowania obserwatora, który sprowadza jeden błąd estymowanego stanu do zera w skończonym czasie, nawet przy występowaniu błędu pomiaru; w pozostałych stanach występuje błąd, który zachowuje się podobnie do błędu obserwatora Luenbergera po ustąpieniu pików. Obserwatorzy w trybie ślizgowym mają również atrakcyjne właściwości odporności na zakłócenia, które są podobne do filtra Kalmana . Innym podejściem jest zastosowanie multi-obserwatora, który znacząco poprawia stany nieustalone i redukuje przeregulowanie obserwatora. Multi obserwator może być dostosowany do każdego systemu, w którym ma zastosowanie High Gain Observer.

Obserwatorzy stanu dla układów nieliniowych

Wysokie wzmocnienie, tryb ślizgowy i obserwatorzy rozszerzone są najczęstszymi obserwatorami systemów nieliniowych. Aby zilustrować zastosowanie obserwatorów trybu ślizgowego dla systemów nieliniowych, najpierw rozważmy system nieliniowy bez danych wejściowych:

gdzie . Załóżmy również, że istnieje mierzalny wynik podany przez

Istnieje kilka nieprzybliżonych podejść do projektowania obserwatora. Dwóch obserwatorów podanych poniżej stosuje się również w przypadku, gdy system ma wejście. To jest,

Linearyzowalna dynamika błędów

Jedna z sugestii Krenera i Isidori oraz Krenera i Respondka może być zastosowana w sytuacji, gdy istnieje transformacja linearyzująca (tzn. dyfeomorfizm , jak ta stosowana w linearyzacji ze sprzężeniem zwrotnym ) taka, że ​​w nowych zmiennych równania systemowe czytają

Obserwator Luenberger jest następnie zaprojektowany jako

.

Błąd obserwatora dla transformowanej zmiennej spełnia to samo równanie, co w klasycznym przypadku liniowym.

.

Jak pokazali Gauthier, Hammouri i Othman oraz Hammouri i Kinnaert, jeśli istnieje transformacja taka, że ​​system może zostać przekształcony w formę

wtedy obserwator jest zaprojektowany jako

,

gdzie jest zmienny w czasie zysk obserwatora.

Ciccarella, Dalla Mora i Germani uzyskali bardziej zaawansowane i ogólne wyniki, usuwając potrzebę przekształcenia nieliniowego i udowadniając globalną asymptotyczną zbieżność oszacowanego stanu do stanu rzeczywistego, stosując tylko proste założenia dotyczące regularności.

Obserwator trybu ślizgowego

Jak omówiono dla powyższego przypadku liniowego, zjawisko pikowania występujące w obserwatorach Luenbergera uzasadnia użycie obserwatora modu ślizgowego . Obserwator w trybie ślizgowym wykorzystuje nieliniowe sprzężenie zwrotne o wysokim wzmocnieniu do kierowania szacowanych stanów do hiperpowierzchni, gdzie nie ma różnicy między szacowanym wyjściem a zmierzonym wyjściem. Wzmocnienie nieliniowe stosowane w obserwatorze jest zazwyczaj implementowane za pomocą skalowanej funkcji przełączania, takiej jak signum (tj. sgn) szacowanego – zmierzonego błędu wyjściowego. Stąd, z powodu tego sprzężenia zwrotnego o dużym wzmocnieniu, pole wektorowe obserwatora jest zagięte, tak że trajektorie obserwatora przesuwają się wzdłuż krzywej, gdzie szacowany wynik dokładnie odpowiada zmierzonemu wynikowi. Tak więc, jeśli system jest obserwowalny z jego danych wyjściowych, wszystkie stany obserwatora zostaną przeniesione do rzeczywistych stanów systemu. Dodatkowo, wykorzystując znak błędu do napędzania obserwatora w trybie ślizgowym, trajektorie obserwatora stają się niewrażliwe na wiele form szumu. W związku z tym niektórzy obserwatorzy w trybie przesuwnym mają atrakcyjne właściwości podobne do filtru Kalmana, ale z prostszą implementacją.

Zgodnie z sugestią Drakunova, obserwator ślizgowy można również zaprojektować dla klasy układów nieliniowych. Taki obserwator można zapisać w kategoriach oryginalnego oszacowania zmiennej i ma postać

gdzie:

  • Wektor obejmuje skalarnych funkcji signum do wymiarów. To jest,
    dla wektora .
  • Wektor ma składniki, które są funkcją wyjściową i jej powtarzającymi się pochodnymi Liego. W szczególności,
    gdzie jest i- pochodną Lie funkcji wyjścia wzdłuż pola wektorowego (tj. wzdłuż trajektorii układu nieliniowego). W szczególnym przypadku, gdy system nie ma wejście lub ma względny stopień z n , to zbiór wyjścia i jego pochodne. Ponieważ odwrotnością Jacobiego linearyzacji of musi istnieć dla tego obserwatora być dobrze zdefiniowane, transformacja jest gwarancją miejscowy dyfeomorfizmu .
  • Macierzą diagonalną z korzyści jest taka, że
    gdzie dla każdego elementu i odpowiednio duży, aby zapewnić osiągalność trybu przesuwnego.
  • Wektor obserwatora jest taki, że
    gdzie tutaj jest normalna funkcja signum zdefiniowana dla skalarów i oznacza „operator wartości równoważnej” funkcji nieciągłej w trybie przesuwania.

Pomysł można krótko wyjaśnić w następujący sposób. Zgodnie z teorią trybów ślizgowych, aby opisać zachowanie systemu, po rozpoczęciu trybu ślizgowego funkcję należy zastąpić wartościami równoważnymi (patrz równoważne sterowanie w teorii trybów ślizgowych ). W praktyce przełącza (gada) z dużą częstotliwością, przy składowej wolnej równej wartości ekwiwalentnej. Zastosowanie odpowiedniego filtra dolnoprzepustowego w celu pozbycia się włączonej składowej wysokiej częstotliwości pozwala uzyskać wartość sterowania równoważnego, która zawiera więcej informacji o stanie estymowanego układu. Opisany powyżej obserwator wykorzystuje tę metodę kilkakrotnie, aby uzyskać stan układu nieliniowego idealnie w skończonym czasie.

Zmodyfikowany błąd obserwacji można zapisać w stanach przekształconych . W szczególności,

a więc

Więc:

  1. Dopóki , pierwszy rząd dynamiki błędu, , będzie spełniał warunki wystarczające do wejścia w tryb ślizgowy w skończonym czasie.
  2. Na powierzchni odpowiednia kontrolka równoważna będzie równa , i tak . Stąd tak długo, jak , drugi rząd dynamiki błędu, , wejdzie w tryb ślizgowy w skończonym czasie.
  3. Na powierzchni odpowiednia kontrola równoważna będzie równa . W związku z tym, o ile The ty rząd dynamiki błędów wejdzie do trybu ślizgowych w ograniczonym czasie.

Tak więc, dla wystarczająco dużych zysków, wszystkie stany oszacowane przez obserwatora osiągają stan rzeczywisty w skończonym czasie. W rzeczywistości zwiększanie umożliwia osiągnięcie zbieżności w dowolnym pożądanym, skończonym czasie, o ile każda funkcja może być powiązana z pewnością. Stąd wymóg, aby odwzorowanie było dyfeomorfizmem (tj. aby jego linearyzacja jakobianu była odwracalna) zakłada, że ​​zbieżność oszacowanego wyniku implikuje zbieżność oszacowanego stanu. Oznacza to, że wymaganie jest warunkiem obserwowalności.

W przypadku obserwatora trybu ślizgowego dla układu z wejściem konieczne są dodatkowe warunki, aby błąd obserwacji był niezależny od wejścia. Na przykład, że

nie zależy od czasu. Obserwator jest wtedy

Wielu obserwatorów

Multi Observer rozszerza strukturę High Gain Observer z jednego do wielu obserwatorów, z wieloma modelami pracującymi jednocześnie. Ma on dwie warstwy: pierwsza składa się z wielu obserwatorów o dużym wzmocnieniu z różnymi stanami estymacji, a druga określa wagi ważności obserwatorów pierwszej warstwy. Algorytm jest prosty w implementacji i nie zawiera żadnych ryzykownych operacji, takich jak różnicowanie. Pomysł wielu modeli był wcześniej stosowany w celu uzyskania informacji w sterowaniu adaptacyjnym.

Załóżmy, że liczba obserwatorów wysokiego zysku wynosi n +1

gdzie jest indeks obserwatora. Obserwatorzy pierwszej warstwy mają takie samo wzmocnienie, ale różnią się od stanu początkowego . W drugiej warstwie wszystkie z obserwatorów są łączone w jeden, aby uzyskać oszacowanie pojedynczego wektora stanu

gdzie są czynniki wagowe. Czynniki te są zmieniane, aby zapewnić estymację w drugiej warstwie i usprawnić proces obserwacji.

Załóżmy, że

i

gdzie jest jakiś wektor, który zależy od błędu obserwatora .

Niektóre transformacje prowadzą do problemu regresji liniowej

Wzór ten daje możliwość szacowania . Aby skonstruować rozmaitość, potrzebujemy mapowania między i zapewnienia, które jest obliczalne w oparciu o mierzalne sygnały. Pierwszą rzeczą jest wyeliminowanie zjawiska parkowania z powodu błędu obserwatora

.

Oblicz pochodną czasów, aby znaleźć odwzorowanie m prowadzące do zdefiniowanego jako

gdzie jest pewna stała czasowa. Należy zauważyć, że przekaźniki na obu i ich całkach, dlatego są łatwo dostępne w systemie sterowania. Dalej określa prawo szacowania; a tym samym dowodzi, że rozmaitość jest mierzalna. W drugiej warstwie na wprowadza się jako estymat współczynników. Błąd mapowania jest określony jako

gdzie . Jeżeli współczynniki są równe , to błąd odwzorowania Teraz można obliczyć z powyższego równania, a co za tym idzie zjawisko pikowania jest redukowane dzięki właściwościom rozmaitości. Stworzone mapowanie daje dużą elastyczność w procesie estymacji. Nawet możliwe jest oszacowanie wartości w drugiej warstwie i obliczenie stanu .

Obserwatorzy ograniczający

Obserwatorzy ograniczający lub interwałowy stanowią klasę obserwatorów, które zapewniają dwie oceny stanu jednocześnie: jedna z ocen zapewnia górną granicę rzeczywistej wartości stanu, podczas gdy druga zapewnia dolną granicę. Wiadomo zatem, że rzeczywista wartość stanu zawsze mieści się w tych dwóch szacunkach.

Granice te są bardzo ważne w zastosowaniach praktycznych, ponieważ umożliwiają każdorazowe poznanie dokładności estymacji.

Matematycznie można użyć dwóch obserwatorów Luenbergera, jeśli są odpowiednio dobrane, wykorzystując na przykład dodatnie własności układów : jeden dla górnej granicy (która zapewnia zbieżność do zera z góry, gdy , przy braku szumu i niepewności ), oraz dolna granica (która zapewnia, że zbiega się do zera od dołu). To znaczy zawsze

Zobacz też

Bibliografia

Referencje w linii
Ogólne odniesienia General

Linki zewnętrzne