Transformacja Legendre'a - Legendre transformation

Funkcja jest zdefiniowana w przedziale . Różnica wynosi maksymalnie . Tak więc .

W matematyce , Transformacja Legendre'a (lub Legendre przekształcać ), nazwany Adrien-Marie Legendre , jest involutive transformacja na rzeczywistych -valued funkcji wypukłych jednej zmiennej rzeczywistej. W problemach fizycznych służy do przekształcania funkcji jednej wielkości (takich jak położenie, ciśnienie lub temperatura) na funkcje wielkości sprzężonej (odpowiednio pędu, objętości i entropii). W ten sposób jest powszechnie stosowany w mechanice klasycznej do wyprowadzania formalizmu hamiltonowskiego z formalizmu Lagrange'a iw termodynamice do wyprowadzania potencjałów termodynamicznych , jak również do rozwiązywania równań różniczkowych kilku zmiennych.

Dla wystarczająco gładkich funkcji na linii rzeczywistej, transformatę Legendre'a funkcji można określić, aż do stałej addytywnej, pod warunkiem, że pierwsze pochodne funkcji są funkcjami odwrotnymi względem siebie. Można to wyrazić w notacji pochodnej Eulera jako

gdzie oznacza funkcję taką, że

lub, równoważnie, jak i w notacji Lagrange'a .

Uogólnienie transformacji Legendre'a na przestrzenie afiniczne i funkcje niewypukłe jest znane jako sprzężenie wypukłe (zwane również transformacją Legendre'a-Fenchela), które można wykorzystać do skonstruowania wypukłej powłoki funkcji .

Definicja

Niech być przerwa , a wypukła funkcja ; wtedy jego transformata Legendre'a jest funkcją zdefiniowaną przez

gdzie oznacza supremum , a domeną jest

Przekształcenie jest zawsze dobrze zdefiniowane, gdy jest wypukłe .

Uogólnienie na funkcje wypukłe na zbiorze wypukłym jest proste: ma dziedzinę

i jest zdefiniowany przez

gdzie oznacza iloczyn skalarny z i .

Funkcja ta nazywana jest wypukłą funkcją sprzężoną . Ze względów historycznych (zakorzenionych w mechanice analitycznej) zmienna sprzężona jest często oznaczana zamiast . Jeżeli funkcja wypukła jest zdefiniowana na całej linii i jest wszędzie różniczkowalna , to

mogą być interpretowane jako negatyw -intercept z linią styczną do wykresu z która ma nachylenie .

Transformacja Legendre'a to zastosowanie dwoistości relacji między punktami i liniami. Relacja funkcjonalna określona przez może być reprezentowana w równym stopniu jako zbiór punktów lub jako zbiór linii stycznych określonych przez ich wartości nachylenia i przecięcia.

Zrozumienie przekształcenia w terminach pochodnych

Dla różniczkowalnej funkcji wypukłej na prostej z odwracalną pierwszą pochodną transformatę Legendre'a można określić, aż do stałej addytywnej, pod warunkiem, że pierwsze pochodne funkcji są funkcjami odwrotnymi względem siebie. Jawnie, dla różniczkowalnej funkcji wypukłej na prostej rzeczywistej z pierwszą pochodną z odwrotnością , transformatę Legendre'a (z pochodną z odwrotnością ) można określić, aż do stałej addytywnej, pod warunkiem, że i są wzajemnie odwrotnymi funkcjami, tj. , i .

Aby to zobaczyć, najpierw zauważ, że jeśli jest różniczkowalna i jest punktem krytycznym funkcji , to supremum jest osiągane w (przez wypukłość). Dlatego .

Załóżmy, że jest odwracalny i niech oznacza jego odwrotność. Następnie dla każdego , punkt jest unikalnym punktem krytycznym . Rzeczywiście i tak . Stąd mamy dla każdego . Rozróżniając w odniesieniu do odnajdujemy

Ponieważ upraszcza to . Innymi słowy i są odwrotne.

Ogólnie rzecz biorąc, jeśli jest odwrotnością , to i tak całkowanie zapewnia stałą, tak że .

W praktyce, biorąc pod uwagę , wykres parametryczny versus równa się wykresowi versus .

W niektórych przypadkach (np. potencjały termodynamiczne, poniżej) stosowane jest wymaganie niestandardowe, sprowadzające się do alternatywnej definicji f * ze znakiem minus ,

Nieruchomości

  • Transformata Legendre'a funkcji wypukłej jest wypukła.
Pokażmy to dla przypadku podwójnie różniczkowalnej z niezerową (a więc dodatnią, ze względu na wypukłość) pochodną podwójną.
Dla ustalonego , zmaksymalizujmy . Następnie zauważając, że zależy od . Zatem,
Sama pochodna jest różniczkowalna z pochodną dodatnią, a więc jest ściśle monotoniczna i odwracalna.
Więc gdzie , co oznacza, że jest tak zdefiniowany, że .
Zauważ, że jest to również różniczkowalna z następującą pochodną,
Tak więc jest złożenie funkcji różniczkowalnych, a więc różniczkowalnych.
Zastosowanie reguły produktu i reguły łańcucha daje
dający
tak jest wypukły.
  • Wynika z tego, że transformacja Legendre'a jest inwolucją , czyli :
Korzystając z powyższych równości dla , i jego pochodnej,

Przykłady

Przykład 1

e x jest zaznaczony na czerwono, a jego transformacja Legendre'a jest przerywana na niebiesko.

Funkcja wykładnicza ma postać transformacji Legendre'a, ponieważ ich odpowiednie pierwsze pochodne e x i ln p są funkcjami odwrotnymi względem siebie.

Ten przykład ilustruje, że odpowiednie domeny funkcji i jej transformata Legendre'a nie muszą się zgadzać.

Przykład 2

Niech f ( x ) = cx 2 określone na ℝ, gdzie c > 0 jest stałą stałą.

Dla x * fixed, funkcja x , x * xf ( x ) = x * xcx 2 ma pierwszą pochodną x * – 2 cx i drugą pochodną −2 c ; istnieje jeden punkt stacjonarny w x = x */2 c , który jest zawsze maksimum.

Zatem I * = ℝ i

Pierwsze pochodne f , 2 cx i f * , x */(2 c ) są funkcjami odwrotnymi względem siebie. Oczywiście, ponadto

mianowicie f ** = f .

Przykład 3

Niech f ( x ) = x 2 dla xI = [2, 3] .

Dla x * fixed , x * xf ( x ) jest ciągła na I compact , stąd zawsze przyjmuje na niej skończone maksimum; wynika z tego , że I * = ℝ .

Punkt stacjonarny w x = x */2 znajduje się w dziedzinie [2, 3] wtedy i tylko wtedy, gdy 4 ≤ x * ≤ 6 , w przeciwnym razie maksimum jest przyjmowane albo w x = 2 , albo x = 3 . Wynika, że

Przykład 4

Funkcja f ( x ) = cx jest wypukła dla każdego x (ścisła wypukłość nie jest wymagana, aby transformacja Legendre'a była dobrze zdefiniowana). Oczywiście x * xf ( x ) = ( x * − c ) x nigdy nie jest ograniczony od góry jako funkcja x , chyba że x * − c = 0 . Stąd f * jest zdefiniowane na I * = { c } i f * ( c ) = 0 .

Można sprawdzić ewolucjonizm: oczywiście x * xf *( x *) jest zawsze ograniczone w funkcji x * ∈ { c } , stąd I ** = ℝ . Wtedy dla wszystkich x jeden ma

i stąd f **( x ) = cx = f ( x ) .

Przykład 5: kilka zmiennych

Pozwolić

być zdefiniowane na X = ℝ n , gdzie A jest rzeczywistą, dodatnio określoną macierzą.

Wtedy f jest wypukłe, a

ma gradient p − 2 Ax i Hessian − 2 A , który jest ujemny; stąd punkt stacjonarny x = A -1 p /2 jest maksimum.

Mamy X * = ℝ n , oraz

Zachowanie różnic w przekształceniach Legendre'a

Transformacja Legendre'a jest powiązana z integracją przez części ,   pdx = d ( px ) − xdp .

Niech f będzie funkcją dwóch niezależnych zmiennych x i y , z różniczką

Załóżmy, że jest ona wypukła w x dla wszystkich y , aby można było przeprowadzić transformację Legendre'a w x , ze zmienną p sprzężoną z x . Ponieważ nową zmienną niezależną jest p , różniczki dx i dy przechodzą do dp i dy , tj. budujemy inną funkcję z jej różniczką wyrażoną w postaci nowej bazy dp i dy .

Rozważamy zatem funkcję g ( p , y ) = fpx tak, że

Funkcja -g ( p , y ) jest transformacją Legendre'a f ( x , y ) , gdzie tylko zmienna niezależna x została zastąpiona przez p . Jest to szeroko stosowane w termodynamice, jak pokazano poniżej.

Aplikacje

Mechanika analityczna

Transformacja Legendre'a jest używana w mechanice klasycznej do wyprowadzenia sformułowania Hamiltona z sformułowania Lagrange'a i odwrotnie. Typowy lagranżjan ma formę

gdzie są współrzędne na R n × R n , M jest dodatnią macierzą rzeczywistą, a

Dla każdego q ustalonego, jest funkcją wypukłą , natomiast pełni rolę stałej.

Stąd transformata Legendre'a jako funkcji v jest funkcją Hamiltona,

.

W bardziej ogólnym ustawieniu są współrzędne lokalne na wiązce stycznej rozmaitości . Dla każdego q , jest wypukłą funkcją przestrzeni stycznej V q . Legendre'a przekształcenie daje Hamiltona , jako funkcja współrzędnych ( p , q ) w wiązce cotangent ; produkt wewnętrzny użyty do zdefiniowania transformacji Legendre'a jest dziedziczony z odpowiedniej kanonicznej struktury symplektycznej . W tym abstrakcyjnym otoczeniu transformacja Legendre'a odpowiada tautologicznej jednej formie .

Termodynamika

Strategią stojącą za użyciem transformat Legendre'a w termodynamice jest przejście od funkcji zależnej od zmiennej do nowej (sprzężonej) funkcji zależnej od nowej zmiennej, sprzężonej pierwotnej. Nowa zmienna jest pochodną cząstkową funkcji pierwotnej względem zmiennej pierwotnej. Nowa funkcja to różnica między pierwotną funkcją a iloczynem starej i nowej zmiennej. Zazwyczaj transformacja ta jest użyteczna, ponieważ przesuwa zależność np. energii ze zmiennej ekstensywnej na jej sprzężoną zmienną intensywną, którą zwykle łatwiej można kontrolować w eksperymencie fizycznym.

Na przykład energia wewnętrzna jest jawną funkcją ekstensywnych zmiennych entropii , objętości i składu chemicznego

który ma całkowitą różnicę

Określając pewien wspólny stan odniesienia, za pomocą (niestandardowej) transformacji Legendre'a energii wewnętrznej U , w odniesieniu do objętości, V , entalpię można określić, pisząc

co jest teraz jawną funkcją ciśnienia P , ponieważ

Entalpia nadaje się do opisu procesów, w których ciśnienie jest kontrolowane z otoczenia.

Możliwe jest również przesunięcie zależności energii ze zmiennej ekstensywnej entropii S , na (często wygodniejszą) zmienną intensywną T , co daje swobodne energie Helmholtza i Gibbsa . Energia swobodna Helmholtza, A i energia Gibbsa, G , są uzyskiwane poprzez wykonanie transformacji Legendre odpowiednio energii wewnętrznej i entalpii,

Energia swobodna Helmholtza jest często najbardziej użytecznym potencjałem termodynamicznym, gdy temperatura i objętość są kontrolowane z otoczenia, podczas gdy energia Gibbsa jest często najbardziej użyteczna, gdy temperatura i ciśnienie są kontrolowane z otoczenia.

Przykład – zmienny kondensator

Jako kolejny przykład z fizyki rozważmy kondensator z płytami równoległymi , w którym płyty mogą się poruszać względem siebie. Kondensator taki umożliwiłby przeniesienie zgromadzonej w nim energii elektrycznej na zewnętrzną pracę mechaniczną, wykonywaną siłą działającą na płytki. Można myśleć o ładunku elektrycznym jako analogicznym do „ładunku” gazu w cylindrze , z wynikającą z tego siłą mechaniczną wywieraną na tłok .

Oblicz siłę na płytach jako funkcję x , czyli odległości, która je dzieli. Aby znaleźć siłę, oblicz energię potencjalną, a następnie zastosuj definicję siły jako gradient funkcji energii potencjalnej.

Energia zmagazynowana w kondensatorze o pojemności C ( x ) i ładunku Q wynosi

gdzie zależność od powierzchni płytek, stałej dielektrycznej materiału między płytami i separacji x są odejmowane jako pojemność C ( x ) . (W przypadku kondensatora z płytami równoległymi jest to proporcjonalne do powierzchni płyt i odwrotnie proporcjonalne do separacji.)

Siła F między płytami spowodowana polem elektrycznym wynosi wtedy

Jeśli kondensator nie jest podłączony do układu, to koszty na płytkach są stałe w czasie ich ruchu, a siła ujemna gradientu z elektrostatycznego energię

Załóżmy jednak, że napięcie między płytkami V jest utrzymywane na stałym poziomie dzięki połączeniu z akumulatorem , który jest zbiornikiem do ładowania przy stałej różnicy potencjałów; teraz ładunek jest zmienny zamiast napięcia, jego koniugatu Legendre'a. Aby znaleźć siłę, najpierw oblicz niestandardową transformację Legendre'a,

Siła staje się teraz ujemnym gradientem tej transformacji Legendre'a, wciąż wskazującą w tym samym kierunku,

Dwa sprzężone energii stało stoją naprzeciw siebie, tylko ze względu na liniowość tego pojemności -except teraz P nie jest stała. Odzwierciedlają one dwie różne ścieżki magazynowania energii w kondensatorze, co skutkuje np. tym samym „ciągnięciem” między płytkami kondensatora.

Teoria prawdopodobieństwa

W dużej teorii odchylenia The funkcja stawka jest zdefiniowany jako transformacji Legendre'a z logarytmu funkcja tworząca momenty zmiennej losowej. Ważnym zastosowaniem funkcji wskaźnika jest obliczanie prawdopodobieństw ogona sum iid zmiennych losowych.

Mikroekonomia

Transformacja Legendre'a pojawia się naturalnie w mikroekonomii w procesie znajdowania podaży S ( P ) jakiegoś produktu przy ustalonej cenie P na rynku znając funkcję kosztu C ( Q ) , tj. koszt wytworzenia/wydobycia/itd. Q jednostek danego produktu.

Prosta teoria wyjaśnia kształt krzywej podaży w oparciu wyłącznie o funkcję kosztu. Załóżmy, że cena rynkowa jednej jednostki naszego produktu wynosi P . Dla firmy sprzedającej ten towar najlepszą strategią jest takie dostosowanie produkcji Q, aby zmaksymalizować jej zysk. Możemy zmaksymalizować zysk

przez różnicowanie względem Q i rozwiązywanie

Q opt reprezentuje optymalną ilość Q dóbr, którą producent jest skłonny dostarczyć, co w rzeczywistości jest samą dostawą:

.

Jeśli rozważymy maksymalny zysk jako funkcję ceny, widzimy, że jest to transformata Legendre'a funkcji kosztu .

Interpretacja geometryczna

W przypadku funkcji ściśle wypukłej transformację Legendre'a można interpretować jako odwzorowanie między wykresem funkcji a rodziną stycznych wykresu. (Dla funkcji jednej zmiennej styczne są w ogóle dobrze zdefiniowane, ale w co najwyżej przeliczalnie wielu punktach, ponieważ funkcja wypukła jest różniczkowalna w ogóle, ale w co najwyżej przeliczalnie wielu punktach.)

Równanie prostej z nachyleniem i przecięciem jest podane przez Aby ta linia była styczna do wykresu funkcji w punkcie wymaga

oraz

Będąc pochodną funkcji ściśle wypukłej, funkcja jest ściśle monotoniczna, a zatem iniektywna . Drugie równanie można rozwiązać, aby umożliwić eliminację z pierwszego i rozwiązać przecięcie stycznej w funkcji jej nachylenia

gdzie oznacza transformację Legendre'a

Rodzina linii stycznej do wykresu parametryzowana przez nachylenie jest więc podaje

lub, napisane niejawnie, rozwiązaniami równania

Wykres pierwotnej funkcji można zrekonstruować z tej rodziny linii jako obwiednię tej rodziny poprzez wymaganie

Wyeliminowanie z tych dwóch równań daje

Identyfikacji z oraz uznając prawą stronę poprzedniego równania jako Legendre transformacji plonów

Transformacja Legendre'a w więcej niż jednym wymiarze

Dla różniczkowalnej funkcji o wartościach rzeczywistych na otwartym wypukłym podzbiorze U z R n sprzężenie Legendre'a pary ( U , f ) jest zdefiniowane jako para ( V , g ) , gdzie V jest obrazem U w odwzorowaniu gradientowym Df i g to funkcja na V wyrażona wzorem

gdzie

jest iloczynem skalarnym na R n . Przekształcenie wielowymiarowe można interpretować jako kodowanie wypukłej powłoki epigrafu funkcji pod kątem wspierających ją hiperpłaszczyzn .

Alternatywnie, jeśli X jest przestrzenią wektorową, a Y jest jej podwójną przestrzenią wektorową , to dla każdego punktu x od X i y od Y , istnieje naturalna identyfikacja przestrzeni kostycznych T* X x z Y i T* Y y z X . Jeśli f jest rzeczywistą różniczkowalną funkcją nad X , to jej zewnętrzna pochodna , df , jest odcinkiem wiązki kostycznej T* X i jako taka możemy skonstruować odwzorowanie od X do Y . Podobnie, jeśli g jest rzeczywistą różniczkowalną funkcją nad Y , to dg definiuje odwzorowanie od Y do X . Jeśli obie mapy są odwrotne do siebie, mówimy, że mamy transformację Legendre'a. Pojęcie tautologicznej jedynki jest powszechnie używane w tym kontekście.

Gdy funkcja nie jest różniczkowalna, transformacja Legendre'a może być nadal rozszerzona i jest znana jako transformacja Legendre-Fenchel . W tym bardziej ogólnym ustawieniu traci się kilka właściwości: na przykład transformacja Legendre'a nie jest już swoją własną odwrotnością (chyba że istnieją dodatkowe założenia, takie jak wypukłość ).

Transformacja Legendre'a na rozmaitościach

Niech będzie gładką rozmaitością , niech będzie wiązką wektorową , i niech będzie gładką funkcją. Myślimy o postaci Lagrange'a przez analogię do klasycznego przypadku, gdy , a dla niektórych liczbę dodatnią i funkcji . Jak zwykle oznaczamy przez podwójny z , przez włókna przejęcia , oraz ograniczenia do . Legendre'a transformacji z jest gładka morfizmem

zdefiniowane przez , gdzie . Innymi słowy, jest kowektorem, który wysyła do pochodnej kierunkowej .

Aby opisać transformację Legendre'a lokalnie, niech będzie wykresem współrzędnych, nad którym jest trywialne. Wybierając trywializację ponad , otrzymujemy wykresy i . W zakresie tych wykresów mamy , gdzie

dla wszystkich .

Jeśli, jak w przypadku klasycznym, ograniczenie do każdego włókna jest ściśle wypukłe i ograniczone poniżej dodatnio określoną formą kwadratową minus stała, to transformata Legendre'a jest dyfeomorfizmem. Załóżmy, że jest to dyfeomorfizm i niech będzie funkcją „ hamiltonian ” określoną przez

gdzie . Używając naturalnego izomorfizmu , możemy postrzegać transformację Legendre'a jako mapę . Potem będzie

Dalsze właściwości

Skalowanie właściwości

Transformacja Legendre'a ma następujące właściwości skalowania: Dla a > 0 ,

Wynika z tego, że jeśli funkcja jest jednorodna stopnia r to jej obraz w przekształceniu Legendre'a jest funkcją jednorodną stopnia s , gdzie 1/ r + 1/ s = 1 . (Ponieważ f ( x ) = x r / r , gdzie r > 1 , implikuje f * ( p ) = p s / s .) Zatem jedynym jednomianem, którego stopień jest niezmienny w transformacji Legendre'a, jest kwadrat.

Zachowanie podczas tłumaczenia

Zachowanie przy inwersji

Zachowanie przy przekształceniach liniowych

Niech A  : R nR m będzie przekształceniem liniowym . Dla dowolnej funkcji wypukłej f na R n , należy

gdzie * jest operatorem sprzężona z A określa

i Af jest nacisk do przodu na f wzdłuż A

Zamknięty wypukłość funkcji F jest symetryczna w stosunku do danego zestawu G z ortogonalnym przekształceń liniowych ,

wtedy i tylko wtedy, gdy f * jest symetryczne względem G .

Infinal convolution

Splotu infimal dwóch funkcji f i g jest zdefiniowana jako

Niech f 1 , ..., f m będą odpowiednimi funkcjami wypukłymi na R n . Następnie

Nierówność Fenchela

Dla dowolnej funkcji f i jej koniugatu wypukłego f * nierówność Fenchela (znana również jako nierówność Fenchela-Younga ) zachodzi dla każdego xX i pX * , tj. niezależnych par x , p ,

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki