Sterowanie trybem przesuwnym - Sliding mode control

W systemach sterowania , sterowanie ślizgowe ( SMC ) jest nieliniowa sterowania sposób modyfikacji Potworna dynamika o nieliniowość Dzięki zastosowaniu nieciągłego sterowania (lub bardziej rygorystycznie sygnał sterujący zestaw wartości), który powoduje systemowi „suwaka” wzdłuż przekrój normalnego zachowania systemu. Stan - zwrotna prawo kontroli nie jest funkcją ciągłą czasu. Zamiast tego może przełączać się z jednej ciągłej struktury na drugą w oparciu o bieżącą pozycję w przestrzeni stanów. W związku z tym sterowanie trybem ślizgowym jest metodą sterowania zmienną strukturą . Wiele struktur sterujących zaprojektowano tak, aby trajektorie zawsze przesuwały się w kierunku sąsiedniego regionu o innej strukturze sterującej, a zatem ostateczna trajektoria nie będzie istniała całkowicie w obrębie jednej struktury sterującej. Zamiast tego będzie przesuwać się wzdłuż granic struktur kontrolnych. Ruch układu, gdy przesuwa się wzdłuż tych granic nazywany jest sposób przesuwny i geometryczny Lokus składający granic nazywany jest przesuwny (hiper) powierzchni . W kontekście współczesnej teorii sterowania każdy układ o zmiennej strukturze , podobnie jak układ w SMC, może być postrzegany jako szczególny przypadek hybrydowego układu dynamicznego, ponieważ układ zarówno przepływa przez ciągłą przestrzeń stanów, jak i porusza się w różnych dyskretnych trybach sterowania.

Wstęp

Rysunek 1: Trajektoria płaszczyzny fazowej systemu stabilizowanego przez sterownik trybu ślizgowego. Po początkowej fazie dotarcia system stwierdza „slajdy” wzdłuż linii . Szczególna powierzchnię wybrano, ponieważ pożądane zmniejszonej dynamiki rzędu gdy ograniczony do niego. W tym przypadku powierzchnia odpowiada systemowi LTI pierwszego rzędu , który ma wykładniczo stabilny początek.

Na rysunku 1 pokazano przykładową trajektorię systemu pod kontrolą trybu ślizgowego. Powierzchnia ślizgowa jest opisana przez , a tryb ślizgania się po powierzchni rozpoczyna się po skończonym czasie, gdy trajektorie układu dochodzą do powierzchni. W teoretycznym opisie trybów ślizgowych system pozostaje ograniczony do powierzchni ślizgowej i musi być postrzegany jedynie jako ślizgający się po powierzchni. Jednak rzeczywiste implementacje sterowania w trybie ślizgowym aproksymują to teoretyczne zachowanie za pomocą sygnału sterującego przełączaniem o wysokiej częstotliwości i ogólnie niedeterministycznego, który powoduje, że system „drgaje” w ciasnym sąsiedztwie powierzchni ślizgowej. Drgania można ograniczyć, stosując strefy nieczułości lub warstwy graniczne wokół powierzchni ślizgowej lub inne metody kompensacyjne. Chociaż system jest ogólnie nieliniowy, wyidealizowane (tj. bez gadania) zachowanie systemu na rysunku 1, gdy jest on ograniczony do powierzchni, jest systemem LTI o wykładniczo stabilnym pochodzeniu.

Intuicyjnie sterowanie w trybie ślizgowym wykorzystuje praktycznie nieskończone wzmocnienie, aby wymusić przesuwanie się trajektorii układu dynamicznego wzdłuż ograniczonej podprzestrzeni trybu ślizgowego. Trajektorie z tego trybu ślizgowego zredukowanego rzędu mają pożądane właściwości (np. system naturalnie ślizga się wzdłuż niego, aż do osiągnięcia pożądanej równowagi ). Główną zaletą sterowania w trybie ślizgowym jest jego solidność . Ponieważ sterowanie może być tak proste, jak przełączanie między dwoma stanami (np. „włączony”/„wyłączony” lub „do przodu”/„wsteczny”), nie musi być precyzyjne i nie będzie czułe na zmiany parametrów, które wchodzą do Kanał sterowania. Dodatkowo, ponieważ prawo sterowania nie jest funkcją ciągłą , tryb ślizgowy można osiągnąć w skończonym czasie (tj. lepszym niż zachowanie asymptotyczne). W pewnych typowych warunkach optymalność wymaga użycia kontroli hukowo-wybuchowej ; stąd sterowanie w trybie ślizgowym opisuje optymalny sterownik dla szerokiego zestawu systemów dynamicznych.

Jednym z zastosowań sterownika trybu ślizgowego jest sterowanie napędami elektrycznymi sterowanymi przez przełączające przekształtniki mocy. Ze względu na nieciągły tryb pracy tych przetworników, nieciągły sterownik trybu ślizgowego jest naturalnym wyborem implementacyjnym w stosunku do sterowników ciągłych, które mogą wymagać zastosowania za pomocą modulacji szerokości impulsu lub podobnej techniki dostarczania ciągłego sygnału do wyjścia, które może bierz tylko stany dyskretne. Sterowanie w trybie przesuwnym ma wiele zastosowań w robotyce. W szczególności ten algorytm sterowania został z dużym powodzeniem wykorzystany do śledzenia kontroli bezzałogowych statków nawodnych na symulowanych wzburzonych morzach.

Sterowanie trybem przesuwnym musi być stosowane z większą ostrożnością niż inne formy sterowania nieliniowego, które mają bardziej umiarkowane działanie sterowania. W szczególności, ponieważ siłowniki mają opóźnienia i inne niedoskonałości, twarde działanie sterowania w trybie ślizgowym może prowadzić do drgania, utraty energii, uszkodzenia instalacji i wzbudzenia niemodelowanej dynamiki. Metody projektowania ciągłego sterowania nie są tak podatne na te problemy i mogą naśladować sterowniki w trybie ślizgowym.

System kontroli

Rozważmy nieliniowy układ dynamiczny opisany przez

 

 

 

 

( 1 )

gdzie

jest n -wymiarowym wektorem stanu i

jest m- wymiarowym wektorem wejściowym, który będzie używany do sprzężenia zwrotnego stanu . Te funkcje i są uważane za stałe i wystarczająco gładka tak, że Twierdzenie Picarda mogą być wykorzystane w celu zapewnienia, że rozwiązania równania ( 1 ) istnieje i jest unikalny .

Częstym zadaniem jest zaprojektowanie prawa sterowania ze sprzężeniem zwrotnym (tj. odwzorowanie stanu bieżącego w czasie t na wejście ) w celu ustabilizowania układu dynamicznego w równaniu ( 1 ) wokół początku . Oznacza to, że zgodnie z prawem kontroli za każdym razem, gdy system zostanie uruchomiony z dala od źródła, powróci do niego. Na przykład, składnik wektora stanu może reprezentować różnicę, w jakiej pewne wyjście jest oddalone od znanego sygnału (np. pożądanego sygnału sinusoidalnego); jeśli sterowanie może zapewnić, że szybko powróci do , to wyjście będzie śledzić pożądaną sinusoidę. W sterowaniu ślizgowym projektant wie, że układ zachowuje się w sposób pożądany (np. ma stabilną równowagę ) pod warunkiem, że jest ograniczony do podprzestrzeni swojej przestrzeni konfiguracyjnej . Sterowanie w trybie ślizgowym wymusza trajektorie systemu w tej podprzestrzeni, a następnie utrzymuje je tam, aby przesuwały się wzdłuż niej. Ta podprzestrzeń zredukowanego rzędu jest określana jako przesuwająca się (hiper)powierzchnia , a gdy sprzężenie zwrotne w pętli zamkniętej wymusza przesuwanie się trajektorii wzdłuż niej, jest określane jako tryb ślizgowy systemu z zamkniętą pętlą. Trajektorie wzdłuż tej podprzestrzeni można porównać do trajektorii wzdłuż wektorów własnych (tj. trybów) systemów LTI ; jednak tryb przesuwania jest wymuszany przez fałdowanie pola wektorowego za pomocą sprzężenia zwrotnego o wysokim wzmocnieniu. Podobnie jak marmur toczący się po szczelinie, trajektorie są ograniczone do trybu ślizgowego.

Schemat sterowania w trybie przesuwnym obejmuje:

  1. Wybór hiperpowierzchni lub kolektora (tj. powierzchni ślizgowej) tak, że trajektoria systemu wykazuje pożądane zachowanie, gdy jest ograniczona do tego kolektora.
  2. Znalezienie sprzężenia zwrotnego zyskuje tak, że trajektoria systemu przecina się i pozostaje na rozmaitości.

Ponieważ prawa sterowania trybem ślizgowym nie są ciągłe , ma on możliwość kierowania trajektorii do trybu ślizgowego w skończonym czasie (tj. stabilność powierzchni ślizgowej jest lepsza niż asymptotyczna). Jednak gdy trajektorie dotrą do powierzchni ślizgowej, układ nabiera charakteru trybu ślizgowego (np. początek może mieć tylko asymptotyczną stabilność na tej powierzchni).

Projektant trybu ślizgowego wybiera funkcję przełączania, która reprezentuje rodzaj "odległości", w której stany są oddalone od powierzchni ślizgowej.

  • Stan, który znajduje się poza tą powierzchnią ślizgową, ma .
  • Stan, który jest na tej powierzchni ślizgowej ma .

Prawo sterowania trybem ślizgowym przełącza się z jednego stanu do drugiego na podstawie znaku tej odległości. Tak więc sterowanie w trybie ślizgowym działa jak sztywne ciśnienie zawsze pchające w kierunku trybu ślizgowego, gdzie . Pożądane trajektorie zbliżają się do powierzchni ślizgowej, a ponieważ prawo sterowania nie jest ciągłe (tj. przełącza się z jednego stanu do drugiego, gdy trajektorie poruszają się po tej powierzchni), powierzchnia zostaje osiągnięta w skończonym czasie. Gdy trajektoria dotrze do powierzchni, będzie się po niej ślizgać i może na przykład przesuwać się w kierunku początku. Tak więc funkcja przełączania jest jak mapa topograficzna z konturem o stałej wysokości, po której trajektorie są zmuszone się poruszać.

Przesuwna (hiper)powierzchnia ma wymiar, gdzie n jest liczbą stanów w, a m jest liczbą sygnałów wejściowych (tj. sygnałów sterujących) w . Dla każdego wskaźnika kontrolnego istnieje powierzchnia ślizgowa określona wzorem

 

 

 

 

( 2 )

Istotną częścią projektu SMC jest wybór prawa sterowania tak, aby tryb ślizgowy (tj. ta powierzchnia podana przez ) istniał i był osiągalny wzdłuż trajektorii systemu. Zasada sterowania trybem ślizgowym polega na przymusowym ograniczaniu systemu, za pomocą odpowiedniej strategii sterowania, do pozostawania na powierzchni ślizgowej, na której system będzie wykazywał pożądane cechy. Gdy system jest ograniczony przez sterowanie ślizgowe do pozostania na powierzchni ślizgowej, dynamiką systemu rządzi system zredukowanego rzędu uzyskany z równania ( 2 ).

Aby zmusić stany systemu do spełnienia , należy:

  1. Upewnij się, że system jest w stanie dotrzeć do każdego stanu początkowego
  2. Po osiągnięciu akcja sterująca jest w stanie utrzymać system na poziomie

Istnienie rozwiązań zamkniętej pętli

Należy zauważyć, że ponieważ prawo sterowania nie jest ciągłe , to z pewnością nie jest lokalnie ciągłe Lipschitza , a zatem istnienie i jednoznaczność rozwiązań w układzie pętli zamkniętej nie jest gwarantowane przez twierdzenie Picarda-Lindelöfa . Tak więc rozwiązania należy rozumieć w sensie Filippowa . Z grubsza mówiąc, wynikowy system zamkniętej pętli poruszający się wzdłuż jest aproksymowany przez płynną dynamikę, jednak to płynne zachowanie może nie być naprawdę możliwe do zrealizowania. Podobnie, szybka modulacja szerokości impulsu lub modulacja delta-sigma wytwarza wyjścia, które przyjmują tylko dwa stany, ale efektywna moc wyjściowa zmienia się w ciągłym zakresie ruchu. Tych komplikacji można uniknąć, stosując inną nieliniową metodę projektowania sterowania , która tworzy regulator ciągły. W niektórych przypadkach projekty sterowania w trybie ślizgowym można aproksymować innymi projektami sterowania ciągłego.

Podstawą teoretyczną

Poniższe twierdzenia stanowią podstawę sterowania zmienną strukturą.

Twierdzenie 1: Istnienie trybu ślizgowego

Rozważ kandydata do funkcji Lapunowa

 

 

 

 

( 3 )

gdzie jest normą euklidesową (tj. jest odległością od rozmaitości przesuwnej gdzie ). Dla układu określonego równaniem ( 1 ) i powierzchni ślizgowej określonej równaniem ( 2 ) wystarczającym warunkiem istnienia modu poślizgu jest to, że

w sąsiedztwie powierzchni podanej przez .

Ogólnie rzecz biorąc (czyli dla skalarnego przypadku sterowania kiedy ), aby osiągnąć , prawo sterowania ze sprzężeniem zwrotnym jest odbierany tak, i mają przeciwne znaki. To znaczy,

  • robi negatywne, gdy jest pozytywne.
  • robi pozytywne, gdy jest negatywne.

Zauważ, że

tak więc prawo kontroli sprzężenia zwrotnego ma bezpośredni wpływ na .

Osiągalność: Osiągnięcie przesuwnego kolektora w skończonym czasie

Aby zapewnić, że tryb ślizgowy zostanie osiągnięty w skończonym czasie, musi być silniej ograniczony od zera. Oznacza to, że jeśli zniknie zbyt szybko, atrakcyjność trybu ślizgowego będzie tylko asymptotyczna. Aby zapewnić, że tryb przesuwny zostanie wprowadzony w skończonym czasie,

gdzie i są stałymi.

Wyjaśnienie przez porównanie lemat

Warunek ten zapewnia, że ​​dla sąsiedztwa trybu przesuwnego ,

Tak więc dla ,

co, zgodnie z regułą łańcucha (tj. z ), oznacza

gdzie jest górna pochodną prawostronnym z a symbol oznacza proporcjonalności . Zatem porównując krzywą reprezentowaną przez równanie różniczkowe z warunkiem początkowym , musi być tak, że dla wszystkich t . Co więcej, ponieważ , musi osiągnąć w skończonym czasie, co oznacza, że V musi osiągnąć (tj. system wchodzi w tryb ślizgowy) w skończonym czasie. Ponieważ jest proporcjonalny do normy euklidesowej funkcji przełączania , wynik ten implikuje, że prędkość zbliżania się do modu ślizgowego musi być mocno ograniczona od zera.

Konsekwencje kontroli trybu ślizgowego

W kontekście sterowania w trybie ślizgowym warunek ten oznacza, że

gdzie jest norma euklidesowa . W przypadku, gdy funkcja przełączania ma wartość skalarną, warunkiem wystarczającym staje się

.

Biorąc , skalarny warunek wystarczający staje się

co jest równoznaczne z warunkiem, że

.

Oznacza to, że system powinien zawsze poruszać się w kierunku powierzchni przełączającej , a jego prędkość w kierunku powierzchni przełączającej powinna mieć niezerową dolną granicę. Tak więc, nawet jeśli może stać się znikająco mały w miarę zbliżania się do powierzchni, zawsze musi być mocno ograniczony od zera. Aby zapewnić ten warunek, sterowniki trybu przesuwnego są nieciągłe w kolektorze; że przełączanie z jednej wartości niezerowej do drugiego, jak tory przekroczyć kolektora.

Twierdzenie 2: Region przyciągania

Dla układu określonego równaniem ( 1 ) i powierzchni ślizgowej określonej równaniem ( 2 ) podprzestrzeń, dla której powierzchnia jest osiągalna, dana jest wzorem

To znaczy, gdy warunki początkowe pochodzą całkowicie z tej przestrzeni, kandydatem do funkcji Lapunowa jest funkcja Lapunowa, a trajektorie z pewnością będą poruszać się w kierunku powierzchni modów ślizgowych, gdzie . Co więcej, jeśli spełnione są warunki osiągalności z Twierdzenia 1, tryb ślizgowy wejdzie w obszar, w którym jest silniej ograniczony od zera w skończonym czasie. Stąd tryb ślizgowy zostanie osiągnięty w skończonym czasie.

Twierdzenie 3: Ruch ślizgowy

Pozwolić

być niesingularne . Oznacza to, że system ma pewien rodzaj sterowalności, który zapewnia, że ​​zawsze istnieje kontrola, która może przesunąć trajektorię, aby zbliżyć się do trybu przesuwania. Następnie, po osiągnięciu trybu przesuwnego , system pozostanie w tym trybie przesuwnym. Wzdłuż trajektorii modu ślizgowego jest stała, więc trajektorie modu ślizgowego są opisane równaniem różniczkowym

.

Jeśli równowaga - jest stabilna w odniesieniu do tego równania różniczkowego, to układ będzie przesuwał się po powierzchni modu ślizgowego w kierunku równowagi.

Równoważne prawo kontrola trybu przesuwnego można znaleźć rozwiązywania

dla równoważnego prawa kontrolnego . To znaczy,

a więc kontrola równoważna

Oznacza to, że nawet jeśli rzeczywista regulacja nie jest ciągła , szybkie przełączanie trybu ślizgowego zmusza system do działania tak, jakby był napędzany przez to ciągłe sterowanie.

Podobnie trajektorie systemu w trybie ślizgowym zachowują się tak, jakby

Otrzymany układ jest zgodny z równaniem różniczkowym trybu ślizgowego

, powierzchnia trybu ślizgowego i warunki trajektorii z fazy osiągania zmniejszają się teraz do wyżej wyprowadzonego prostszego warunku. W związku z tym można założyć, że system podąża za prostszym warunkiem po pewnym początkowym stanie przejściowym w okresie, gdy system znajduje tryb ślizgowy. Ten sam ruch jest w przybliżeniu zachowany, gdy równość utrzymuje się tylko w przybliżeniu.

Z twierdzeń tych wynika, że ​​ruch ślizgowy jest niezmienny (tj. niewrażliwy) na wystarczająco małe zakłócenia wchodzące do układu przez kanał sterowania. Oznacza to, że dopóki regulacja jest wystarczająco duża, aby zapewnić, że i jest równomiernie oddzielona od zera, tryb ślizgowy będzie utrzymywany tak, jakby nie było zakłóceń. Jego najbardziej atrakcyjną cechą jest niezmienniczość sterowania ślizgowego względem pewnych zakłóceń i niepewności modelu; jest bardzo wytrzymały .

Jak omówiono w poniższym przykładzie, prawo sterowania trybem ślizgowym może utrzymać ograniczenie

w celu asymptotycznej stabilizacji dowolnego układu formy

kiedy ma skończoną górną granicę. W tym przypadku tryb przesuwania jest tam, gdzie

(tj. gdzie ). Oznacza to, że gdy układ jest w ten sposób ograniczony, zachowuje się jak prosty stabilny układ liniowy , a więc ma globalnie wykładniczo stabilną równowagę w punkcie początkowym.

Przykłady projektów sterowania

  • Rozważmy instalację opisaną równaniem ( 1 ) z pojedynczym wejściem u (tj . ). Funkcja przełączania jest wybierana jako kombinacja liniowa

 

 

 

 

( 4 )

gdzie waga dla wszystkich . Powierzchnia ślizgowa to simpleks, gdzie . Kiedy trajektorie są zmuszone do przesuwania się po tej powierzchni,
a więc
który jest systemem zredukowanego rzędu (tj. nowy system jest uporządkowany, ponieważ system jest ograniczony do tego jednowymiarowego trybu ślizgowego simplex). Powierzchnia ta może mieć korzystne właściwości (np. gdy dynamika roślin zmuszona jest ślizgać się po tej powierzchni, przesuwają się one w kierunku pochodzenia ). Biorąc pochodną funkcji Lapunowa z równania ( 3 ), mamy
Aby zapewnić , należy wybrać prawo kontroli sprzężenia zwrotnego, aby
Stąd iloczyn, ponieważ jest iloczynem liczby ujemnej i dodatniej. Zauważ, że

 

 

 

 

( 5 )

Prawo kontrolne zostało wybrane tak, aby
gdzie
  • jest pewną kontrolą (np. być może ekstremalną, jak „on” lub „forward”), która zapewnia, że ​​równanie ( 5 ) (tj. ) jest ujemne w punkcie
  • jest pewną kontrolą (np. być może ekstremalną, jak „wyłączony” lub „odwrócony”), która zapewnia, że ​​równanie ( 5 ) (tj. ) jest dodatnie przy
Wynikowa trajektoria powinna poruszać się w kierunku powierzchni ślizgowej, gdzie . Ponieważ rzeczywiste systemy mają opóźnienie, trajektorie trybu ślizgowego często drgają tam i z powrotem wzdłuż tej powierzchni ślizgowej (tj. prawdziwa trajektoria może nie podążać płynnie , ale zawsze po jej opuszczeniu powróci do trybu ślizgowego).
co można wyrazić w dwuwymiarowej przestrzeni stanów (z i ) jako
Załóżmy również, że (tj. ma skończoną górną granicę k, która jest znana). W przypadku tego systemu wybierz funkcję przełączania
W poprzednim przykładzie musimy wybrać prawo kontroli sprzężenia zwrotnego , aby . Tutaj,
  • Kiedy (tj. kiedy ), aby , prawo kontrolne powinno być wybrane tak, aby
  • Kiedy (tj. kiedy ), aby , prawo kontrolne powinno być wybrane tak, aby
Jednak przez trójkąt nierówności ,
i przez założenie o ,
Tak więc układ może być stabilizowany sprzężeniem zwrotnym (powrót do trybu ślizgowego) za pomocą prawa sterowania
które można wyrazić w formie zamkniętej jako
Zakładając, że trajektorie systemu są zmuszone do ruchu tak, że , wtedy
Kiedy więc układ osiągnie tryb ślizgowy, jego dwuwymiarowa dynamika zachowuje się jak ten jednowymiarowy układ, który ma globalnie stabilną równowagę wykładniczą w .

Zautomatyzowane rozwiązania projektowe

Chociaż istnieją różne teorie dotyczące projektowania systemów sterowania z trybem ślizgowym, brakuje wysoce efektywnej metodologii projektowania z powodu praktycznych trudności napotykanych w metodach analitycznych i numerycznych. Paradygmat obliczeniowy wielokrotnego użytku, taki jak algorytm genetyczny, można jednak wykorzystać do przekształcenia „nierozwiązywalnego problemu” optymalnego projektu w praktycznie rozwiązywalny „niedeterministyczny problem wielomianowy”. Wynikiem tego są zautomatyzowane komputerowo projekty do sterowania modelami ślizgowymi.

Obserwator trybu ślizgowego

Sterowanie w trybie ślizgowym można wykorzystać w projektowaniu obserwatorów stanu . Ci nieliniowi obserwatorzy o wysokim wzmocnieniu mają możliwość sprowadzenia współrzędnych dynamiki błędu estymatora do zera w skończonym czasie. Dodatkowo, obserwatorzy w trybie przełączania mają atrakcyjną odporność na zakłócenia pomiaru, która jest podobna do filtru Kalmana . Dla uproszczenia, przykład tutaj wykorzystuje tradycyjną modyfikację trybu ślizgowego obserwatora Luenberger dla systemu LTI . W tych obserwatorach trybu ślizgowego kolejność dynamiki obserwatora jest zmniejszana o jeden, gdy układ wchodzi w tryb ślizgowy. W tym konkretnym przykładzie błąd estymatora dla pojedynczego estymowanego stanu jest sprowadzany do zera w skończonym czasie, a po tym czasie inne błędy estymatora zanikają wykładniczo do zera. Jednak, jak po raz pierwszy opisał Drakunov, można zbudować obserwatora w trybie ślizgowym dla układów nieliniowych, który sprowadza błąd estymacji dla wszystkich estymowanych stanów do zera w skończonym (i arbitralnie krótkim) czasie.

Tutaj rozważ system LTI

gdzie wektor stanu , jest wektorem wejść, a wyjście y jest skalarem równym pierwszemu stanowi wektora stanu. Pozwolić

gdzie

  • jest skalarem reprezentującym wpływ pierwszego stanu na siebie,
  • jest wektorem wierszowym odpowiadającym wpływowi pierwszego stanu na inne stany,
  • jest macierzą reprezentującą wpływ innych stanów na siebie, oraz
  • jest wektorem kolumnowym reprezentującym wpływ innych stanów na pierwszy stan.

Celem jest zaprojektowanie obserwatora stanu o wysokim wzmocnieniu, który szacuje wektor stanu przy użyciu wyłącznie informacji z pomiaru . Niech więc wektor będzie estymatami n stanów. Obserwator przyjmuje formę

gdzie jest nieliniową funkcją błędu między estymowanym stanem a wyjściem i jest wektorem wzmocnienia obserwatora, który służy podobnemu celowi jak w typowym liniowym obserwatorze Luenbergera . Podobnie niech

gdzie jest wektorem kolumnowym. Dodatkowo niech będzie błąd estymatora stanu. To znaczy . Dynamika błędów jest wtedy

gdzie jest błędem estymatora dla pierwszego oszacowania stanu. Nieliniowe prawo sterowania v można zaprojektować w celu wymuszenia rozmaitości przesuwnej

więc oszacowanie śledzi rzeczywisty stan po pewnym skończonym czasie (np . ). Stąd funkcja przełączania sterowania trybem przesuwnym

Aby osiągnąć rozmaitość przesuwną, i zawsze musi mieć przeciwne znaki (czyli w zasadzie dla wszystkich ). Jednakże,

gdzie jest zbiór błędów estymatora dla wszystkich stanów niezmierzonych. Aby to zapewnić , niech

gdzie

Oznacza to, że dodatnia stała M musi być większa niż skalowana wersja maksymalnych możliwych błędów estymatora dla systemu (tj. początkowe błędy, co do których zakłada się, że są ograniczone, aby M można było wybrać wystarczająco duże; al). Jeśli M jest wystarczająco duże, można założyć, że system osiąga (tj . ). Ponieważ jest stała (tzn. 0) również wzdłuż tej rozmaitości . Stąd nieciągłą kontrolę można zastąpić równoważną kontrolą ciągłą, gdzie

Więc

Ta równoważna kontrola reprezentuje wkład innych stanów w trajektorię stanu wyjściowego . W szczególności wiersz działa jak wektor wyjściowy dla podsystemu błędów

Tak więc, aby zapewnić zbieżność błędu estymatora dla stanów niezmierzonych do zera, wektor musi być wybrany tak, aby macierz była Hurwitzem (tj. rzeczywista część każdej z jej wartości własnych musi być ujemna). Stąd, pod warunkiem, że jest to obserwowalne , układ ten może być ustabilizowany w dokładnie taki sam sposób, jak typowy obserwator stanu liniowego, gdy jest postrzegany jako macierz wyjściowa (tj. „ C ”). Oznacza to, że sterowanie równoważne dostarcza informacji pomiarowych o stanach niezmierzonych, które mogą w sposób ciągły przybliżać swoje oszacowania do nich asymptotycznie. Tymczasem sterowanie nieciągłe wymusza estymację mierzonego stanu na zerowy błąd w skończonym czasie. Dodatkowo, biały symetryczny szum pomiarowy o średniej zerowej (np. szum Gaussa ) wpływa tylko na częstotliwość przełączania sterowania v , a zatem szum będzie miał niewielki wpływ na równoważne sterowanie w trybie ślizgowym . Stąd obserwator w trybie przesuwnym ma cechy podobne do filtru Kalmana .

Ostateczna wersja obserwatora jest zatem

gdzie

  • oraz

Oznacza to, że poprzez rozszerzenie wektora sterowania o funkcję przełączania , obserwator trybu ślizgowego może być zaimplementowany jako system LTI. Oznacza to, że sygnał nieciągły jest postrzegany jako wejście sterujące do 2-wejściowego systemu LTI.

Dla uproszczenia, ten przykład zakłada, że ​​obserwator trybu ślizgowego ma dostęp do pomiaru pojedynczego stanu (tj. wyjścia ). Jednak podobna procedura może być użyta do zaprojektowania obserwatora trybu ślizgowego dla wektora ważonych kombinacji stanów (tj. gdy wyjście używa ogólnej macierzy C ). W każdym przypadku trybem ślizgowym będzie rozmaitość, w której oszacowana moc wyjściowa podąża za zmierzoną mocą wyjściową z zerowym błędem (tj. rozmaitość gdzie ).

Zobacz też

Uwagi

Bibliografia

  • Shtessel, Y.; Edwards, C.; Fridman, L.; Lewant, A. (2014). Sterowanie i obserwacja trybu przesuwnego . Bazylea: Birkhauser. Numer ISBN 978-0-81764-8923.
  • Fridman, L.; Moreno, J.; Bandyopadhyay, B.; Kamal Asif Chalanga, S.; Chalanga, S. (2020). Ciągłe algorytmy zagnieżdżone: piąta generacja kontrolerów trybu przesuwnego. W: Ostatnie postępy w trybach przesuwnych: od sterowania do inteligentnej mechatroniki, X. Yu, O. Efe (red.), s. 5-35, . Studia z systemów, decyzji i kontroli. 24 . Londyn: Springer-Verlag. doi : 10.1007/978-3-319-18290-2_2 . Numer ISBN 978-3-319-18289-6.

Dalsza lektura

  • Steinberger, M.; Róg, M.; Fridman, L., wyd. (2020). Systemy o zmiennej strukturze i sterowanie w trybie przesuwnym . Studia z systemów, decyzji i kontroli. 271 . Londyn: Springer-Verlag. doi : 10.1007/BFb0033675 . Numer ISBN 978-3-030-36620-9.