Mnożnik Lagrange'a - Lagrange multiplier

W optymalizacji matematycznej The metoda mnożników Lagrange'a to strategia na znalezienie lokalnego minimum i maksimum o funkcji zastrzeżeniem ograniczeń równości (czyli pod warunkiem, że jeden lub więcej równania muszą być spełnione dokładnie przez wybranych wartościach zmiennych ). Jego nazwa pochodzi od matematyka Josepha-Louisa Lagrange'a . Podstawową ideą jest przekształcenie problemu z ograniczeniami do postaci takiej, aby test różniczkowy problemu nieograniczonego nadal mógł być zastosowany. Związek między gradientem funkcji a gradientami więzów raczej naturalnie prowadzi do przeformułowania pierwotnego problemu, znanego jako funkcja Lagrange'a .

Metodę można podsumować w następujący sposób: aby znaleźć maksimum lub minimum funkcji podlegającej ograniczeniu równości , utwórz funkcję Lagrange'a

i znaleźć punkty stacjonarne z uważany jako funkcja i mnożnika Lagrange'a . Rozwiązanie odpowiadające pierwotnego ograniczonym optymalizacji jest zawsze punkt siodłowy z Lagrange'a funkcji, która może być zidentyfikowana pomiędzy stacjonarnymi punktami z konkretności w graniczącym Heskiego matrycy .

Wielką zaletą tej metody jest to, że umożliwia ona rozwiązanie optymalizacji bez jawnej parametryzacji pod kątem ograniczeń. W rezultacie metoda mnożników Lagrange'a jest szeroko stosowana do rozwiązywania trudnych problemów związanych z ograniczoną optymalizacją. Co więcej, metoda mnożników Lagrange'a jest uogólniona przez warunki Karusha-Kuhna-Tuckera , które mogą również uwzględniać ograniczenia nierównościowe postaci .

Oświadczenie

Poniższe jest znane jako twierdzenie o mnożniku Lagrange'a.

Niech będzie funkcją celu, będzie funkcją ograniczeń, obie należące do (tj. mające ciągłe pierwsze pochodne). Niech będzie optymalnym rozwiązaniem następującego problemu optymalizacyjnego, takim, że ranga :

(Tutaj oznacza macierz pochodnych cząstkowych, .)

Istnieją też unikalne mnożniki Lagrange'a takie, że .

Twierdzenie Lagrange'a o mnożniku mówi, że w dowolnym lokalnym maksimach (lub minimach) funkcji ocenianej w warunkach równości, jeśli kwalifikacja ograniczenia ma zastosowanie (wyjaśniono poniżej), wówczas gradient funkcji (w tym punkcie) można wyrazić jako kombinację liniową gradientów ograniczeń (w tym punkcie), przy czym mnożniki Lagrange'a pełnią rolę współczynników . Jest to równoznaczne z stwierdzeniem, że każdy kierunek prostopadły do ​​wszystkich gradientów więzów jest również prostopadły do ​​gradientu funkcji. Albo jeszcze mówiąc, że pochodna kierunkowa funkcji wynosi 0 w każdym możliwym kierunku.

Pojedyncze ograniczenie

Rysunek 1: Czerwona krzywa pokazuje ograniczenie g ( x , y ) = c . Niebieskie krzywe są konturami f ( x , y ) . Punkt, w którym czerwone wiązanie styka się stycznie z niebieskim konturem, jest maksimum f ( x , y ) wzdłuż wiązania, ponieważ d 1 > d 2 .

W przypadku tylko jednego ograniczenia i tylko dwóch zmiennych wyboru (jak pokazano na rysunku 1), rozważ problem optymalizacji

(Czasami stała addytywna jest pokazywana osobno, a nie jest zawarta w , w którym to przypadku więz jest napisany , jak na rysunku 1.) Zakładamy, że obie i mają ciągłe pierwsze pochodne cząstkowe . Wprowadzamy nową zmienną ( ) zwaną mnożnikiem Lagrange'a (lub nieokreślony mnożnik Lagrange'a ) i badamy funkcję Lagrange'a (lub wyrażenie Lagrange'a lub Lagrange'a ) zdefiniowaną przez

gdzie termin może być dodany lub odjęty. Jeżeli jest maksimum dla pierwotnego problemu z ograniczeniami i , to istnieje takie, że ( ) jest punktem stacjonarnym dla funkcji Lagrange'a (punkty stacjonarne to te punkty, w których pierwsze pochodne cząstkowe są równe zeru). Założenie to nazywa się kwalifikacją ograniczenia. Jednak nie wszystkie punkty stacjonarne dają rozwiązanie pierwotnego problemu, ponieważ metoda mnożników Lagrange'a daje tylko warunek konieczny optymalności w problemach z ograniczeniami. Istnieją również warunki dostateczne dla minimum lub maksimum , ale jeśli dane rozwiązanie kandydata spełnia warunki wystarczające, to gwarantuje się tylko, że rozwiązanie to jest najlepsze lokalnie – czyli lepsze niż jakiekolwiek dopuszczalne pobliskie punkty. Globalny optymalne można znaleźć przez porównywanie wartości pierwotnej funkcji celu w punktach spełniających konieczne i wystarczające lokalne warunki.

Metoda mnożników Lagrange'a opiera się na intuicji, że w maksimum f ( x , y ) nie może rosnąć w kierunku takiego sąsiedniego punktu, który również ma g = 0 . Gdyby tak było, moglibyśmy iść wzdłuż g = 0, aby dostać się wyżej, co oznacza, że ​​punkt początkowy nie jest w rzeczywistości maksimum. Patrząc w ten sposób, jest to dokładny analog do testowania, czy pochodna funkcji nieograniczonej wynosi 0, to znaczy sprawdzamy, czy pochodna kierunkowa wynosi 0 w dowolnym istotnym (realnym) kierunku.

Można wyobrazić kontury o f podane przez F ( x , y ) = d dla różnych wartości d i kontur g podaje g ( x , y ) = C .

Załóżmy, że idziemy wzdłuż linii konturowej z g = c . Interesuje nas znalezienie punktów, w których f prawie się nie zmienia podczas spaceru, ponieważ te punkty mogą być maksimami.

Mogą się to zdarzyć na dwa sposoby:

  1. Moglibyśmy dotknąć konturu f , ponieważ z definicji f nie zmienia się, gdy idziemy wzdłuż jego konturów. Oznaczałoby to, że styczne do warstwic f i g są tutaj równoległe.
  2. Osiągnęliśmy „poziomową” część f , co oznacza, że f nie zmienia się w żadnym kierunku.

Aby sprawdzić pierwszą możliwość (dotykamy warstwic f ), zauważ, że ponieważ gradient funkcji jest prostopadły do ​​warstwic, styczne do warstwic f i g są równoległe wtedy i tylko wtedy, gdy gradienty f i g są równoległe. Zatem chcemy punktów ( x , y ) gdzie g ( x , y ) = c i

dla niektórych

gdzie

są odpowiednie gradienty. Stała jest wymagana, ponieważ chociaż dwa wektory gradientu są równoległe, wielkości wektorów gradientu na ogół nie są równe. Ta stała nazywana jest mnożnikiem Lagrange'a. (W niektórych konwencjach poprzedza znak minus).

Zauważ, że ta metoda rozwiązuje również drugą możliwość, że f jest poziomem: jeśli f jest poziomem, to jego gradient wynosi zero, a ustawienie jest rozwiązaniem niezależnie od .

Aby włączyć te warunki do jednego równania, wprowadzamy funkcję pomocniczą

i rozwiąż

Zauważ, że równa się to rozwiązaniu trzech równań w trzech niewiadomych. To jest metoda mnożników Lagrange'a.

Zauważ , że implikuje , jako pochodna cząstkowa względem is , które wyraźnie wynosi zero wtedy i tylko wtedy, gdy .

Podsumowując

Metoda łatwo uogólnia funkcje na zmienne

co sprowadza się do rozwiązania n + 1 równań w n + 1 niewiadomych.

Ograniczonego ekstrema fkrytyczne punkty z Lagrange'a , ale nie koniecznie są lokalne ekstrema z (patrz przykład 2 poniżej).

Można przeformułować lagranżian na hamiltonian , w którym to przypadku rozwiązania są lokalnymi minimami dla hamiltonianu. Odbywa się to w teorii kontroli optymalnej , w formie zasady minimum Pontryagina .

Fakt, że rozwiązania Lagrange'a niekoniecznie są ekstremami, również nastręcza trudności w optymalizacji numerycznej. Można to rozwiązać, obliczając wielkość gradientu, ponieważ zera wielkości są z konieczności lokalnymi minimami, jak zilustrowano w przykładzie optymalizacji numerycznej .

Wiele ograniczeń

Rysunek 2: Paraboloid ograniczony wzdłuż dwóch przecinających się linii.
Rysunek 3: Mapa konturowa z rysunku 2.

Metodę mnożników Lagrange'a można rozszerzyć do rozwiązywania problemów z wieloma ograniczeniami przy użyciu podobnego argumentu. Rozważmy paraboloidę podlegającą ograniczeniom liniowym, które przecinają się w jednym punkcie. Jako jedyne możliwe rozwiązanie, ten punkt jest oczywiście ograniczonym ekstremum. Jednakże zestaw poziom z wyraźnie nie równolegle do obu ograniczeń, w punkcie przecięcia (patrz figura 3); zamiast tego jest to liniowa kombinacja gradientów dwóch ograniczeń. W przypadku więzów wielokrotnych tego właśnie szukamy: metoda Lagrange'a poszukuje punktów, w których gradient nie jest koniecznie wielokrotnością gradientu pojedynczego ograniczenia, ale w którym jest to liniowa kombinacja wszystkich więzów”. gradienty.

Konkretnie załóżmy, że mamy ograniczenia i poruszamy się po zbiorze punktów spełniających wymagania . Każdy punkt na konturze danej funkcji więzów ma przestrzeń dopuszczalnych kierunków: przestrzeń wektorów prostopadłych do . Zbiór kierunków dozwolonych przez wszystkie więzy jest zatem przestrzenią kierunków prostopadłych do wszystkich gradientów więzów. Oznacz tę przestrzeń dopuszczalnych ruchów przez i oznacz rozpiętość gradientów wiązań przez . Wtedy przestrzeń wektorów prostopadłych do każdego elementu .

Nadal jesteśmy zainteresowani znajdowaniem punktów, w których nie zmienia się podczas spaceru, ponieważ te punkty mogą być (ograniczone) ekstremami. Dlatego szukamy takiego, aby każdy dopuszczalny kierunek ruchu od był prostopadły do (w przeciwnym razie moglibyśmy zwiększyć , poruszając się wzdłuż tego dopuszczalnego kierunku). Innymi słowy, . Tak więc istnieją skalary takie, że

Te skalary są mnożnikami Lagrange'a. Mamy ich teraz , po jednym na każde ograniczenie.

Tak jak poprzednio wprowadzamy funkcję pomocniczą

i rozwiąż

co sprowadza się do rozwiązywania równań w niewiadomych.

Założeniem kwalifikacji ograniczeń, gdy istnieje wiele ograniczeń, jest to, że gradienty ograniczeń w odpowiednim punkcie są liniowo niezależne.

Nowoczesne formułowanie przez rozmaitości różniczkowe

Problem znajdowania lokalnych maksimów i minimów podlegających ograniczeniom można uogólnić na znalezienie lokalnych maksimów i minimów na rozmaitości różniczkowej . W dalszej części nie jest konieczne, aby była to przestrzeń euklidesowa ani nawet rozmaitość riemannowska. Wszystkie wyglądy gradientu (zależne od wyboru metryki riemannowskiej) można zastąpić zewnętrzną pochodną .

Pojedyncze ograniczenie

Niech będzie gładką rozmaitością wymiaru . Załóżmy, że chcemy znaleźć punkty stacjonarne funkcji gładkiej ograniczonej do podrozmaitości zdefiniowanej przez gdzie jest funkcją gładką, dla której 0 jest wartością regularną .

Niech i bądź zewnętrznymi pochodnymi . Stacjonarność dla ograniczenia przy średnich Równoważnie, jądro zawiera Innymi słowy, i są proporcjonalnymi 1-formami. W tym celu konieczne i wystarczające jest, aby następujący układ równań był spełniony:

gdzie oznacza produkt zewnętrzny . Punkty stacjonarne są rozwiązaniami powyższego układu równań plus ograniczenie Należy zauważyć, że równania nie są niezależne, ponieważ lewa strona równania należy do podrozmaitości składających się z elementów rozkładających się .

W tym sformułowaniu nie jest konieczne jednoznaczne znalezienie mnożnika Lagrange'a, liczby takiej, że

Wiele ograniczeń

Niech i bądź jak w powyższej sekcji dotyczącej przypadku pojedynczego ograniczenia. Zamiast funkcji tam opisanej rozważmy teraz funkcję gładką z funkcjami składowymi, dla których jest wartością regularną . Niech będzie podrozmaitością zdefiniowanego przez

jest punktem stacjonarnym wtedy i tylko wtedy, gdy zawiera . Dla wygody pozwolić i , gdzie oznacza mapę styczna lub jakobian Podprzestrzeń ma wymiar mniejszy niż w przypadku , a mianowicie , a należący do wtedy i tylko wtedy, gdy należy z obrazem obliczeniowo biorąc, warunek, że należący do przestrzeni wierszy macierzy lub równoważnie przestrzeń kolumn macierzy (transpozycji). Jeżeli oznacza iloczyn zewnętrzny kolumn macierzy warunku stacjonarnego dla at staje się

Ponownie, w tym sformułowaniu nie jest konieczne, aby jednoznacznie znaleźć mnożniki Lagrange'a, takie liczby , że

Interpretacja mnożników Lagrange'a

Często mnożniki Lagrange'a są interpretowane jako pewna ilość zainteresowania. Na przykład poprzez parametryzację linii konturu ograniczenia, to znaczy, jeśli wyrażenie Lagrange'a to

następnie

Tak więc λ k jest szybkością zmian optymalizowanej wielkości w funkcji parametru ograniczenia. Jako przykłady, w mechanice Lagrange'a równania ruchu są wyprowadzane przez znalezienie stacjonarnych punktów działania , całki po czasie z różnicy między energią kinetyczną i potencjalną. Tak więc siła działająca na cząstkę ze względu na potencjał skalarny, F = −∇ V , może być interpretowana jako mnożnik Lagrange'a określający zmianę działania (przeniesienie potencjału na energię kinetyczną) po zmianie ograniczonej trajektorii cząstki. W teorii sterowania formułuje się to zamiast równań costate .

Co więcej, przez twierdzenie obwiedni optymalna wartość mnożnika Lagrange'a jest interpretowana jako marginalny wpływ odpowiedniej stałej ograniczającej na optymalną osiągalną wartość pierwotnej funkcji celu: jeśli oznaczymy wartości w optimum gwiazdką, to może pokazać, że

Na przykład w ekonomii optymalny zysk gracza jest obliczany przy ograniczonej przestrzeni działań, gdzie mnożnik Lagrange'a jest zmianą optymalnej wartości funkcji celu (zysku) ze względu na rozluźnienie danego ograniczenia (np. poprzez zmiana dochodu); w takim kontekście λ k * jest kosztem krańcowym ograniczenia i jest określana jako cena w tle .

Wystarczające warunki

Wystarczające warunki dla ograniczonego lokalnego maksimum lub minimum można określić w postaci ciągu głównych małoletnich (wyznaczników górno-lewych uzasadnionych podmatryc) obramowanej macierzy Hessów drugich pochodnych wyrażenia Lagrange'a.

Przykłady

Przykład 1

Ilustracja problemu optymalizacji z ograniczeniami 1a

Przykład 1a

Załóżmy, że chcemy zmaksymalizować z zastrzeżeniem ograniczenia . Możliwe zestaw jest okręgu jednostkowego, a ustawia poziom z F są ukośne linie (z nachylenia -1), dzięki czemu widać, że maksymalna graficznej pojawia się , a minimalna występuje przy .

Dla metody mnożników Lagrange'a ograniczeniem jest

W związku z tym

funkcja równoważna funkcji when jest ustawiona na .

Teraz możemy obliczyć gradient:

i dlatego:

Zauważ, że ostatnie równanie jest pierwotnym wiązaniem.

Pierwsze dwa równania dają

Podstawiając do ostatniego równania otrzymujemy:

więc

co oznacza, że ​​stacjonarne punkty są

Obliczanie funkcji celu f w tych punktach daje

Zatem ograniczone maksimum to i ograniczone minimum to .

Przykład 1b

Ilustracja problemu optymalizacji z ograniczeniami 1b

Teraz modyfikujemy funkcję celu z przykładu 1a, aby zminimalizować zamiast ponownie wzdłuż okręgu . Teraz zestawy poziomów to nadal linie nachylenia -1, a punkty na okręgu styczne do tych zestawów poziomów to znowu i . Te punkty styczności to maksima  .

Z drugiej strony minima występują na poziomie ustawionym na  = 0 (ponieważ przez swoją konstrukcję nie może przyjmować wartości ujemnych), w i , gdzie krzywe poziomu nie są styczne do ograniczenia. Warunek, który poprawnie identyfikuje wszystkie cztery punkty jako ekstrema; minima charakteryzują się w szczególności:

Przykład 2

Ilustracja problemu optymalizacji z ograniczeniami

Ten przykład dotyczy bardziej żmudnych obliczeń, ale nadal jest to problem z pojedynczym wiązaniem.

Załóżmy, że ktoś chce znaleźć maksymalne wartości

pod warunkiem, że współrzędne - i - leżą na okręgu wokół początku o promieniu . To znaczy z zastrzeżeniem ograniczenia

Ponieważ istnieje tylko jedno ograniczenie, istnieje jeden mnożnik, powiedzmy .

Ograniczenie ma identyczne zero na okręgu o promieniu . Dowolna wielokrotność może zostać dodana do pozostawienia niezmienionego w obszarze zainteresowania (w okręgu, w którym spełnione jest nasze pierwotne ograniczenie).

Zastosowanie zwykłej metody mnożnikowej Lagrange'a daje

z którego można obliczyć gradient:

I dlatego:

(iii) jest tylko pierwotnym ograniczeniem. (i) implikuje lub . Jeśli to przez (iii) iw konsekwencji z (ii). Jeśli , zastąpienie tego w (ii) daje . Zastąpienie tego w (iii) i rozwiązanie daje . Tak więc istnieje sześć punktów krytycznych :

Oceniając cel w tych punktach, stwierdza się, że:

W związku z tym, funkcja celu osiąga globalnym maksimum (w zależności od ograniczeń w) i globalne minimum w Punkt jest lokalne minimum w i jest lokalne maksimum z , które mogą być określone poprzez rozważenie Heskiego matrycy o .

Zauważ, że chociaż jest punktem krytycznym , nie jest lokalnym ekstremum Mamy

Mając dowolne sąsiedztwo , można wybrać małą wartość dodatnią i małą wartość dowolnego znaku, aby otrzymać wartości zarówno większe, jak i mniejsze niż . Można to również zobaczyć na podstawie macierzy Hessian ocenianej w tym punkcie (lub rzeczywiście w dowolnym z punktów krytycznych), która jest macierzą nieokreśloną . Każdy z punktów krytycznych to punkt siodłowy z .

Przykład 3: Entropia

Załóżmy, że chcemy znaleźć dyskretny rozkład prawdopodobieństwa w punktach o maksymalnej entropii informacyjnej . To to samo, co powiedzenie, że chcemy znaleźć najmniej ustrukturyzowany rozkład prawdopodobieństwa na punktach . Innymi słowy, chcemy zmaksymalizować równanie entropii Shannona :

Aby był to rozkład prawdopodobieństwa, suma prawdopodobieństw w każdym punkcie musi być równa 1, więc nasze ograniczenie jest następujące:

Używamy mnożników Lagrange'a, aby znaleźć punkt maksymalnej entropii, , we wszystkich dyskretnych rozkładach prawdopodobieństwa na . Wymagamy, aby:

co daje układ n równań , taki, że:

Dokonując różniczkowania tych n równań otrzymujemy

To pokazuje, że wszystkie są równe (ponieważ zależą tylko od λ ). Używając ograniczenia

znaleźliśmy

Stąd rozkład jednostajny jest rozkładem o największej entropii wśród rozkładów na n punktach.

Przykład 4: Optymalizacja numeryczna

Mnożniki Lagrange'a powodują, że punkty krytyczne pojawiają się w punktach siodła.
Wielkość gradientu można wykorzystać do wymuszenia występowania punktów krytycznych na lokalnych minimach.

Punkty krytyczne Lagrange'ów występują w punktach siodłowych , a nie w lokalnych maksimach (lub minimach). Niestety, wiele technik optymalizacji numerycznej, takich jak wspinaczka górska , zejście gradientowe , niektóre z metod quasi-Newtonowych , między innymi, są przeznaczone do znajdowania lokalnych maksimów (lub minimów), a nie punktów siodłowych. Z tego powodu należy albo zmodyfikować formułę, aby upewnić się, że jest to problem minimalizacji (na przykład przez ekstremizację kwadratu gradientu Lagrange'a jak poniżej), albo użyć techniki optymalizacji, która znajduje punkty stacjonarne (takich jak metoda Newtona bez ekstremum szukającego linii wyszukiwania ) i niekoniecznie ekstrema.

Jako prosty przykład rozważmy problem znalezienia wartości x, która minimalizuje , ograniczona tak, że . (Ten problem jest nieco patologiczny, ponieważ istnieją tylko dwie wartości, które spełniają to ograniczenie, ale jest to przydatne do celów ilustracyjnych, ponieważ odpowiadającą mu funkcję nieograniczoną można zwizualizować w trzech wymiarach).

Używając mnożników Lagrange'a, problem ten można przekształcić w nieograniczony problem optymalizacji:

Dwa punkty krytyczne występują w punktach siodłowych, gdzie x = 1 i x = -1 .

Aby rozwiązać ten problem za pomocą techniki optymalizacji numerycznej, musimy najpierw przekształcić ten problem tak, aby punkty krytyczne występowały w lokalnych minimach. Odbywa się to poprzez obliczenie wielkości gradientu problemu optymalizacji nieograniczonej.

Najpierw obliczamy pochodną cząstkową problemu nieograniczonego względem każdej zmiennej:

Jeżeli funkcja celu nie jest łatwo różniczkowalna, różniczka względem każdej zmiennej może być aproksymowana jako

gdzie jest mała wartość.

Następnie obliczamy wielkość gradientu, który jest pierwiastkiem kwadratowym z sumy kwadratów pochodnych cząstkowych:

(Ponieważ moduł jest zawsze nieujemny, optymalizacja pod względem kwadratu jest równoważna optymalizacji pod modułem. W związku z tym „pierwiastek kwadratowy” można pominąć w tych równaniach bez oczekiwanej różnicy w wynikach optymalizacji).

Punkty krytyczne h występują przy x = 1 i x = −1 , tak jak w . Jednak w przeciwieństwie do punktów krytycznych w , punkty krytyczne w h występują na lokalnych minimach, więc do ich znalezienia można użyć technik optymalizacji numerycznej.

Aplikacje

Teoria kontroli

W teorii kontroli optymalnej mnożniki Lagrange'a są interpretowane jako zmienne brzegowe , a mnożniki Lagrange'a są przeformułowane jako minimalizacja hamiltonianu zgodnie z zasadą minimum Pontryagina .

Programowanie nieliniowe

Metoda mnożnika Lagrange'a ma kilka uogólnień. W programowaniu nieliniowym istnieje kilka reguł mnożnikowych, np. Carathéodory-John Multiplier Rule i Convex Multiplier Rule, dla ograniczeń nierówności.

Systemy zasilania

Metody oparte na mnożnikach Lagrange'a mają zastosowanie w systemach elektroenergetycznych , np. w rozmieszczaniu rozproszonych zasobów energii (DER) i zrzucaniu obciążenia.

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki

Ekspozycja

Dodatkowy tekst i interaktywne aplety