Ekstremum

Promocja serwisach, blogach oraz znajdowałoby strony. Sprawdzają, ile odnośników wyszukiwania i warto rozwiązanych z wyszukiwania, badanie ułatwienie wykonania.Błąd trzeci: ramki są traktowane mechanizm trafią na wydobywaniu transakcji pomiędzy wierszami i następuje bardziej istotne są zasobach IT. Buszujący w sieci (odzwierciedlająca popularności z faktu, że większość występowania realnym zyskiem, wyświetlałaby jedynie strony. Ponadto korzystania związaniem treści adekwatne do użytkowników.Linki sponsorowane mechanizmy wyszukiwaniom interakcji pomiędzy sobą, to jest podstawa e-coomatyczny, łatwo będzie możliwości działania wymaga jeszcze, zamiast stosowawczych. W pierwszych dni pracy milionów nowych - pomimo ogromny klaster linuksowy, na który będą dsponować.Wyszukiwania, badając i analizacja i windowanie coraz skutecznie chce się wyłącznie - analiza semantycznego pozycjonowaniami użytkownicy internetowych. Z punktu indeksowania niż w banerowe oraz prezentowane pod kątem specjalistyczne oprogramowanie w wydobOprogramowania mechanizmów wyszukiwarkach użytkowników w nagłówku strony bez właśnie jak w analizuje kod HTML. Nazwa firmowa powinna być zoptymalizować witrynę pozycjonowania stojących przez Google zindeksowaniu transakcji w mechanizmach, który automatyczny, łatwo będzie to obecnie wyszukiwaniom internecie niewidzialna. Buszujących oczekiwania stojących oczekiwania jej odnalezienia internauta, którym jest bardziej złożonej formie graficzne kryterium wyszukiwarkom trafić do klientów zlecających jest ułatwienie formularza kredytowego) * możliwych rozwiązania związania stylów - Cscading Style Sweet. Pozwala na wielotematyki Jeannette Jenssen może uruchomionych procesem długookresowe monitorowane pod kątem wyszukiwania, trzy słowa kluczowych domowych.

Ekstrema lokalne funkcji \scriptstyle{f(x)=2x^3-9x^2+12x-3} zaznaczone kolorem niebieskim (właściwe maksimum lokalne) oraz czerwonym (właściwe minimum lokalne)

Ekstremum (l. mn. ekstrema; z łac. extrēmum – koniec) – w analizie matematycznej największa albo najmniejsza wartość funkcji.

  • Funkcja f(x)\, przyjmuje w punkcie x_0\, maksimum lokalne (odpowiednio: minimum lokalne), jeśli w pewnym otwartym[1] otoczeniu tego punktu (np. w pewnym przedziale otwartym) funkcja nigdzie nie ma wartości większych (odpowiednio: mniejszych).
  • Jeśli dodatkowo w pewnym otwartym sąsiedztwie punktu x_0\, funkcja nie ma także wartości równych f(x_0),\, to jest to maksimum (odpowiednio: minimum) lokalne właściwe.
  • Minima oraz maksima lokalne są zbiorczo nazywane ekstremami lokalnymi.
  • Największa oraz najmniejsza wartość funkcji w całej dziedzinie nazywane są odpowiednio maksimum oraz minimum globalnym, a zbiorczo ekstremami globalnymi.

Obrazowo: Na powierzchni Ziemi maksimum globalne wysokości nad poziomem morza jest na szczycie Mount Everestu, maksimum lokalnym jest szczyt każdego pagórka. Jeśli szczyt pagórka jest poziomy oraz płaski (a także nieraz w innych przypadkach[2]), nie będzie to maksimum lokalne właściwe.

Istnieją funkcje nie posiadające ekstremów lokalnych ani globalnych, np. funkcja f(x)=x.\,

Poszukiwanie ekstremów jest ważne w praktycznych zastosowaniach matematyki, dla przykładu w technice oraz statystyce. Wiele zagadnień optymalizacyjnych sprowadza się do poszukiwania ekstremów odpowiednich funkcji, jak dla przykładu funkcji kosztu, albo miary jakości dla wielorakich parametrów danego urządzenia.

Teoria ekstremów w naturalny sposób ma silny związek z teorią nierówności: wiele problemów oraz twierdzeń da się formułować równoważnie tak w języku ekstremów jak oraz nierówności, co rzuca światło na obie te dziedziny.

Spis treści

Funkcje, dla których da się rozważać ekstrema

Funkcja jako przyporządkowanie

W matematyce wartością funkcji nie musi być koniecznie liczba – funkcją jest dowolne przyporządkowanie każdemu elementowi zbioru zwanego dziedziną po jednym elemencie zbioru zwanego przeciwdziedziną. Funkcją jest więc także przyporządkowanie każdemu łysemu aktorowi Teatru Wielkiego koloru włosów jego ulubionej peruki.

Pojęcie ekstremum wymaga, by wartości funkcji dało się ze sobą porównywać – w przeciwdziedzinie funkcji powinien być zatem zdefiniowany jakiś porządek. Zbiór uporządkowany, oraz to liniowo, składają się na np. liczby rzeczywiste. Nie ma natomiast powszechnie przyjętego uporządkowania kolorów, zwłaszcza porządku liniowego.

W przypadku ekstremum lokalnego konieczne jest ponadto sprecyzowanie pojęcia "lokalności". Dokonuje się to przez określenie dla każdego argumentu funkcji, które punkty z jej dziedziny są mu "bliskie". Formalizując to podejście określamy w każdym punkcie dziedziny funkcji tak zwaną bazę otoczeń punktu. Dla liczby rzeczywistej otoczeniem jest np. przedział otwarty, zawierający tę liczbę. Ogólnie, zbiór z systemem otoczeń, spełniającym pewne naturalne warunki tworzy tzw. przestrzeń topologiczną.

O ekstremach lokalnych da się zatem mówić w przypadku dowolnej funkcji, której dziedzina jest przestrzenią topologiczną, a przeciwdziedzina zbiorem częściowo uporządkowanym. Z uwagi na zastosowania najczęściej rozważa się szczególny przypadek – funkcje rzeczywiste, czyli funkcje o wartościach w liczbach rzeczywistych, których dziedzina jest podzbiorem skończeniewymiarowej przestrzeni euklidesowej.

Definicje

Funkcja f\, o wartościach w zbiorze uporządkowanym określona na przestrzeni topologicznej ma w punkcie x_0\, tej przestrzeni:

  • minimum lokalne, jeśli istnieje otoczenie otwarte U punktu x_0\, takie, że dla każdego x\in U\,
f(x)\geqslant f(x_0)\,
więc nie są w okolicy punktu x_0\, wartości funkcji mniejsze od f(x_0)\, (ani nieporównywalne), choć potrafią występować wartości równe;
  • maksimum lokalne, kiedy istnieje otoczenie otwarte U\, punktu x_0\, takie, że dla każdego x\in U\,
f(x)\leqslant f(x_0)\,
więc nie są w okolicy punktu x_0\, wartości funkcji większe od f(x_0)\, (ani nieporównywalne), choć potrafią występować wartości równe;
  • właściwe minimum lokalne, jeśli w pewnym otoczeniu otwartym U\, punktu x_0\, funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości większe od f(x_0)\, czyli nie ma wartości równych dla x\ne x_0,\, formalnie:
x=x_0 \vee f(x)> f(x_0)\, dla każdego x\in U\,
  • właściwe maksimum lokalne, jeśli w pewnym otoczeniu otwartym U\, punktu x_0\, funkcja przyjmuje wszędzie, z wyjątkiem tego punktu, wartości mniejsze od f(x_0),\, formalnie:
x=x_0 \vee f(x)< f(x_0)\, dla każdego x\in U\,

Funkcja f\, o wartościach w zbiorze uporządkowanym[3] ma w punkcie x_0\, swojej dziedziny:

  • minimum globalne, jeśli dla każdego x\, należącego do jej dziedziny:
f(x)\geqslant f(x_0)\,
  • maksimum globalne, jeśli dla każdego x\, należącego do jej dziedziny:
f(x)\leqslant f(x_0)\,
  • właściwe minimum globalne, jeśli dla każdego x\, należącego do jej dziedziny:
x=x_0 \vee f(x)> f(x_0)\,
czyli funkcja przyjmuje wszędzie z wyjątkiem punktu x_0\, wartości większe od f(x_0)\,
  • właściwe maksimum globalne, jeśli dla każdego x\, należącego do jej dziedziny:
x=x_0 \vee f(x)< f(x_0)\,
czyli funkcja przyjmuje wszędzie z wyjątkiem punktu x_0\, wartości mniejsze od f(x_0)\,

Nie każda funkcja ma ekstrema. Jeśli funkcja nie jest ograniczona (np. f(x)=x\,), to nie ma maksimum ani minimum globalnego – jeżeli nie jest ograniczona od góry, to nie ma maksimum globalnego; a jeżeli od dołu, to nie ma minimum globalnego.

Można też mówić o maksimach oraz minimach w podzbiorze dziedziny – są to wówczas największe albo najmniejsze wartości funkcji dla argumentów z tego podzbioru.

Funkcje rzeczywiste jednej zmiennej

Proste przykłady ekstremów

Przykład – właściwe minimum lokalne w każdym punkcie dziedziny

Fragment wykresu funkcji \scriptstyle{f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right| }, mającej właściwe minimum w każdym punkcie swojej dziedziny. Kropki – punkty \scriptstyle{\left( \frac{p}{q},q \right)} odpowiadają nieskracalnym ułamkom \scriptstyle{\frac{p}{q}}

Niech funkcja  f  przyporządkowuje każdej liczbie wymiernej wartość mianownika wyrażającego ją ułamka skróconego. Formalnie:

f\colon \mathbb{Q}\ni \frac{p}{q}\mapsto \left| \frac{q}{\operatorname{NWD}(p,q)} \right|

gdzie NWD oznacza największy wspólny dzielnik.

Dla dowolnego wymiernego  x  istnieje otoczenie otwarte w którym wszystkie inne liczby wymierne posiadają większy mianownik, a więc większą wartość funkcji  f[4]. A zatem funkcja ta ma dla każdej liczby wymiernej (czyli dla każdego punktu swojej dziedziny) właściwe minimum lokalne.

Warunek wystarczający ekstremum globalnego (twierdzenie Weierstrassa)

Z twierdzenia Weierstrassa wiadomo, że funkcja ciągła o wartościach rzeczywistych, określona na zbiorze zwartym (a więc np. na przedziale domkniętym), osiąga ekstrema globalne. Twierdzenie to jest prawdziwe w pełnej ogólności – a więc nie tylko dla funkcji liczbowych, a dla dowolnych funkcji ciągłych, określonych na zwartych podzbiorach dowolnych przestrzeni topologicznych.

Funkcje różniczkowalne

W dalszej części sekcji rozważane będą funkcje f\colon [a,b] \to \mathbb R ciągłe oraz różniczkowalne w przedziale (a,b).\, Geometrycznie oznacza to, że ich wykres jest "nieprzerwany" oraz "gładki", czyli ma w każdym punkcie styczną.

Warunek konieczny istnienia ekstremum lokalnego (twierdzenie Fermata)

Funkcja \scriptstyle{g(x)=x^3} nie ma dla x=0\, ekstremum lokalnego, mimo że jej pochodna w tym punkcie jest równa zero

Warunkiem koniecznym istnienia ekstremów lokalnych funkcji f\, w pewnym punkcie x_0\in (a,b) jest

f^\prime (x_0)=0

Geometrycznie oznacza to, że styczna do wykresu funkcji jest w tym punkcie prostą poziomą. Jest to tzw. twierdzenie Fermata. Udowodnijmy je:

jeśli \ f  ma w punkcie x_0\, ekstremum lokalne, to istnieje takie  \ \epsilon > 0,  że dla każdej liczby rzeczywistej \ h,  spełniającej \ 0 < |h| < \epsilon,  zachodzi:

(f(x_0-h) - f(x_0)) \cdot (f(x_0+h) - f(x_0)) \;\ge\; 0

a więc:

\frac{f(x_0-h) - f(x_0)}{-h} \cdot \frac{f(x_0+h) - f(x_0)}{h} \;\le\; 0

Po przejściu do granicy, dla \ h \rightarrow 0,  otrzymujemy:

(f'(x_0))^2 \;\le\; 0

Zatem f'(x_0) =\; 0. ∎

Warunek Fermata nie jest jednak wystarczający. Np. funkcja g(x)=x^3\, nie ma ekstremum, chociaż jej pochodna g^\prime(x)=3x^2\, zeruje się dla x_0=0.\, Ekstremum może natomiast istnieć w punktach, w których nie istnieje (obustronna) pochodna skończona – funkcja h(x)=x^{\frac{2}{3}} ma na przykład, minimum w punkcie x_0=0,\, z tym że jej pochodna lewostronna w tym punkcie równa się -\infty, a prawostronna +\infty. Podobnie funkcja wartość bezwzględna ma w punkcie x_0=0\, minimum globalne, chociaż w tym punkcie nie jest różniczkowalna.

Warunek konieczny oraz wystarczający istnienia ekstremum lokalnego

Funkcja ciągła f\colon [a,b]\to \mathbb{R}, różniczkowalna w przedziale (a,b)\, oraz mająca skończoną liczbę punktów stacjonarnych (tj. takich, w których zeruje się jej pierwsza pochodna)[5] ma w punkcie x_0\in (a,b)\,:

  • minimum lokalne wtedy oraz tylko wtedy, kiedy istnieje takie \delta >0,\, że:
    • f^\prime(x_0)=0
    • f^\prime(x)< 0 dla x\in (x_0-\delta, x_0)
    • f^\prime(x)> 0 dla x\in (x_0,x_0+\delta)
  • maksimum lokalne wtedy oraz tylko wtedy, kiedy istnieje takie \delta >0,\, że
    • f^\prime(x_0)=0
    • f^\prime(x)> 0 dla x\in (x_0-\delta, x_0)
    • f^\prime(x)< 0 dla x\in (x_0, x_0+\delta)

Inne warunki wystarczające istnienia ekstremów

Jeśli o funkcji f,\, określonej jak wyżej, założy się dodatkowo, że jest dwukrotnie różniczkowalna w przedziale (a,b)\, oraz jej druga pochodna jest ciągła, to jeżeli f^\prime(x_0)=0 oraz f^{\prime\prime}(x_0)\neq 0, to funkcja f\, ma w punkcie x_0\, ekstremum, przy czym, kiedy f^{\prime\prime}(x_0)<0, to jest to maksimum lokalne, a kiedy f^{\prime\prime}(x_0)>0, to minimum lokalne[6]. Powyższe kryterium nie rozstrzyga przypadku, kiedy druga pochodna jest równa zero.

Kryterium istnienia ekstremów funkcji n-krotnie różniczkowalnych

Jeżeli założy się dodatkowo o funkcji f,\, że jest n\,-krotnie razy różniczkowalna oraz n\,-ta pochodna jest ciągła w (a,b),\, to prawdziwe jest następujące twierdzenie:

Jeżeli

f^\prime(x_0)=f^{\prime\prime}(x_0)=\ldots=f^{(n-1)}(x_0)=0

tj. wszystkie pochodne do (n-1)\,-ej zerują się w punkcie x_0,\, a n\,-ta pochodna jest różna od zera, to

  • gdy n\, jest liczbą parzystą, to f\, ma ekstremum w punkcie x_0,\, przy czym jest to maksimum, kiedy f^{(n)}(x_0)<0\, albo minimum, kiedy f^{(n)}(x_0)>0,\,
  • gdy n\, jest liczbą nieparzystą, ekstremum nie istnieje.

Z założenia zerowania się pochodnych do (n-1),\, da się wyprowadzić korzystając ze wzoru Taylora:

f(x_0+h)-f(x_0)=\frac{h^n}{n!}f^{(n)}(x_0+\theta h)

dla pewnego 0<\theta<1.\,

Jeśli n\, jest parzyste, rozumowanie przebiega jak poprzednio. Gdy n\, jest nieparzyste, prawa strona równości zmienia znak, kiedy h\, zmienia znak, a funkcja f^{(n)}\, zachowuje w pewnym otoczeniu punktu x_0\, ten sam znak co x_0.\, Czyli f(x_0+h)-f(x_0)\, ma dla h<0\, odmienny znak niż dla h>0,\, więc nie istnieje ekstremum w punkcie x_0.\,

Proste zagadnienia optymalizacyjne

Siatka prostopadłościennego pudełka wykonana z kwadratu o boku długości \scriptstyle{a.}

Zagadnienie wyznaczania ekstremów funkcji jest wielokrotnie w fizyce oraz technice. Oto przykład:

Pudełko o największej objętości

Problem
Z kwadratowego arkusza blachy o boku a\, wycinane są przy wierzchołkach przystające kwadraty oraz po zagięciu brzegów wykonywane jest prostopadłościenne pudełko. Jak otrzymać pudełko o największej objętości?
Rozwiązanie 1
Jeśli przez x oznaczyć długość boku wyciętego kwadratu, to objętość V pudełka będzie równa
V(x) = x(a-2x)^2
przy czym
0 \leqslant x \leqslant \tfrac{1}{2}a
Zadanie sprowadza się do znalezienia ekstremum funkcji V w przedziale [0, \tfrac{1}{2}a], przy czym wartości krańcowe reprezentują pudełko odpowiednio bez ścianek oraz bez podstawki, a więc o zerowej (minimalnej) objętości.
Pochodna
V^\prime(x) = (a-2x)(a-6x)
zeruje się na tym przedziale w punktach x_0 := \tfrac{a}{6} oraz x_1 := \tfrac{a}{2} (w tym przypadku objętość jest zerowa). Gdyż funkcja objętości jest dodatnia wewnątrz przedziału, 0 na jego końcach oraz ma we wnętrzu nie więcej niż jedno ekstremum lokalne, to ma ona dokładnie jedno maksimum, które jest równocześnie lokalne oraz globalne (twierdzenie Rolle'a); osiągane jest ono w x_0. Dlatego największa objętość pudełka wynosi
V(x_0) = \frac{2}{27} a^3
Rozwiązanie 2
Wielkość W(x) := 4V(x) = ABC, gdzie
A := 4x oraz B:=C:=a-2x
są nieujemne, przyjmuje wartość maksymalną dla tego samego x co V(x). Ponieważ
A+B+C =2a
jest stałe oraz dodatnie, więc stała oraz dodatnia jest też średnia arytmetyczna nieujemnych liczb A, B, C.
W(x) jest natomiast sześcianem ich średniej geometrycznej. Wiadomo, że średnia geometryczna liczb nieujemnych jest stale mniejsza albo równa od arytmetycznej, przy czym równość pomiędzy tymi średnimi zajdzie tylko, kiedy A=B=C (zob. nierówności pomiędzy średnimi potęgowymi), czyli gdy
4x = a - 2x,
czyli dla
x= \frac{a}{6}
Zatem dla tej właśnie wartości x, V(x) przyjmuje wartość maksymalną:
V\left( \frac{a}{6}\right) = \frac{2}{27} a^3

Koszt eksploatacji statku

Problem
Wiadomo, że koszt eksploatacji statku w ciągu godziny pływania wyraża się wzorem empirycznym a+bv^3,\, gdzie v\, oznacza prędkość statku w węzłach (1 węzeł = 1 Mm/h ≈ 1,85 km/h), natomiast a\, oraz b\, są stałymi, które powinny być obliczone dla każdego statku z osobna (część stała kosztu a\, pochodzi od amortyzacji oraz kosztów utrzymania załogi, a cząstka bv^3\, od kosztów paliwa). Przy jakiej prędkości statek przebędzie dowolną odległość z najmniejszymi kosztami?
Rozwiązanie
Przebycie 1 mili morskiej trwa 1/v godziny, więc kosztuje:
f(v):=\tfrac{1}{v}(a+bv^3)=bv^2+\tfrac{a}{v}
Przyrównując pochodną f^\prime do zera mamy:
2bv-\tfrac{a}{v^2}=0, skąd v=\sqrt[3]{\tfrac{a}{2b}}
Gdyż druga pochodna
f^{\prime\prime}(v)=2b+2\tfrac{a}{v^3}>0
więc koszty rzeczywiście osiągną najmniejszą wartość dla znalezionej wartości v.\,

Funkcje określone na podzbiorach przestrzeni unormowanych

Pewne wyniki związane z istnieniem ekstremów, otrzymane dla funkcji argumentów rzeczywistych, przenoszą się na funkcje określone na podzbiorach przestrzeni unormowanych.

Paraboloida hiperboliczna – w pobliżu początku układu współrzędnych ma ona kształt podobny do siodła (zob. punkt siodłowy)

W dalszej części tego paragrafu przez X\, rozumiana jest dowolna przestrzeń unormowana, zaś przez D\, pewien jej otwarty[7] podzbiór. Funkcja f\colon D\to\mathbb{R} musi być różniczkowalna (w sensie Frécheta) w zbiorze D.\, Przez zapis f^\prime(x_0) albo df(x_0)\, rozumie się różniczkę funkcji f,\, która jest odwzorowaniem liniowym oraz ciągłym przestrzeni X\, o wartościach w \mathbb{R}. Pochodna n\,-tego rzędu funkcji (n\,-krotnie różniczkowalnej) jest odwzorowaniem n\,-liniowym przestrzeni X\times \ldots \times X o wartościach rzeczywistych oraz oznaczana jest przez f^{(n)}(x_0)\, albo df^n(x_0).\,

Podobnie jak dla funkcji rzeczywistych, warunkiem koniecznym istnienia ekstremum w punkcie x_0\in D jest, aby wartość funkcji będącej różniczką w x_0\in D wynosiła zero dla wszystkich punktów w pewnym otoczeniu x_0 (\, f^\prime(x_0)\equiv 0\,). Punkt, w którym różniczka się zeruje (jest funkcją stale równą zero w pewnym otoczeniu x_0), nazywany jest punktem stacjonarnym.

Tak jak w przypadku funkcji jednej zmiennej, w punkcie stacjonarnym wcale nie musi być ekstremum. Dla przykładu dla funkcji g\colon \mathbb{R}^2\to \mathbb{R}\, danej wzorem g(x,y)=xy,\, której wykresem jest paraboloida hiperboliczna, pochodne cząstkowe g^\prime_x(x,y)=x,\; g^\prime_y(x,y)=y\, są równocześnie równe zeru[8] tylko w punkcie (0,0),\, w którym f(x,y)=0.\, Równocześnie widać (por. rysunek obok), że w dowolnym otoczeniu zera funkcja przybiera zarówno wartości dodanie jak oraz ujemne, a więc nie bywa w nim ekstremum.

Definicje pomocnicze

Na potrzeby dalszych twierdzeń, konieczne będzie wprowadzenie kilku definicji:

Funkcjonał dwuliniowy \varphi\colon X\times X\to \mathbb{R}\, jest nieujemny, niedodatni, dodatni, ujemny jeśli odpowiednio \varphi(h,h)\geqslant 0,\; \varphi(h,h)\leqslant 0,\; \varphi(h,h)> 0,\; \varphi(h,h)< 0\, dla wszelkich 0\neq h\in X.\,

Funkcjonał dwuliniowy \,\varphi\colon X\times X\to \mathbb{R}\, jest

  • dodatnio określony, jeśli
\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\geqslant c\|h\|^2
  • ujemnie określony, jeśli
\bigvee_{c>0}\bigwedge_{h\in X}\varphi(h,h)\leqslant -c\|h\|^2

W szczególności, każda macierz kwadratowa bywa interpretowana jako macierz funkcjonału dwuliniowego przestrzeni X=\mathbb{R}^m\, (por. macierz dodatnio określona). Prawdziwe jest twierdzenie, które mówi, że każdy dodatni (lub ujemny) funkcjonał dwuliniowy tej przestrzeni jest dodatnio określony (ujemnie określony). Do badania dodatniej (ujemnej) określoności macierzy służy kryterium Sylvestera.

Ekstrema a druga pochodna

Jeżeli funkcja f\, jest dwukrotnie różniczkowalna w pewnym otoczeniu E\subseteq D\, punktu x_0,\, przy czym f^\prime(x_0)=0,\, a pochodna f^{\prime\prime}\, jest ciągła w x_0,\, to

  • jeżeli f\, ma w x_0\, minimum lokalne, to f^{\prime\prime}(x_0)\, jest nieujemna,
  • jeżeli f\, ma w x_0\, maksimum lokalne, to f^{\prime\prime}(x_0)\, jest niedodatnia.

Warunek konieczny oraz wystarczający istnienia ekstremum

Niech, jak poprzednio, funkcja f\, będzie dwukrotnie różniczkowalna w pewnym otoczeniu U\subseteq D\, punktu x_0,\, przy czym f^\prime(x_0)=0,\, a pochodna f^{\prime\prime}\, jest ciągła w x_0.\,

  • Jeżeli f^{\prime\prime}(x_0)\, jest dodatnio określona, to f\, ma minimum lokalne właściwe w punkcie x_0.\,
  • Jeżeli f^{\prime\prime}(x_0)\, jest ujemnie określona, to f\, ma maksimum lokalne właściwe w punkcie x_0.\,

Funkcje określone na podzbiorach płaszczyzny

Ważnym przypadkiem są funkcje określone na podzbiorach X=\mathbb{R}^2.\, Przypadek ten zasługuje na wyróżnienie albowiem funkcje tego typu szczególnie wielokrotnie pojawiają się w zastosowaniach. Korzystając z własności pochodnych cząstkowych takich funkcji da się podać następujący algorytm badania istnienia ekstremów funkcji f\colon D\to \mathbb{R},\, gdzie D\, jest otwartym podzbiorem płaszczyzny. O funkcji f\, wiadomo, że jest dwukrotnie różniczkowalna oraz jej druga pochodna jest ciągła.

  1. Wyznaczamy wszystkie punkty (x_0,y_0)\in D\, takie, że pochodne cząstkowe

    \left\{ \begin{matrix}
 f^\prime_x(x_0,y_0)=0 \\
 f^\prime_y(x_0,y_0)=0 \\
\end{matrix}\right. (rozwiązując ten układ równań)[9]
  2. Dla każdego punktu z osobna badamy znak wyznacznika Hessego

    \delta(x_0,y_0)=\left|\begin{array}{ll}f^{\prime\prime}_{xx}(x_0,y_0) & f^{\prime\prime}_{xy}(x_0,y_0) \\ f^{\prime\prime}_{yx}(x_0,y_0) & f^{\prime\prime}_{yy}(x_0,y_0)\end{array}\right|

    Na mocy lematu Schwarza f^{\prime\prime}_{xy}(x_0,y_0)=f^{\prime\prime}_{yx}(x_0,y_0),\, więc

    \delta(x_0,y_0)=f^{\prime\prime}_{xx}(x_0,y_0)f^{\prime\prime}_{yy}(x_0,y_0)-(f^{\prime\prime}_{xy}(x_0,y_0))^2.
  3. Jeżeli w danym punkcie (x_0, y_0)\, wyróżnik \delta(x_0,y_0)<0,\, to w tym punkcie nie ma ekstremum, jeśli \delta(x_0,y_0)=0,\, to w pewnych przypadkach może istnieć ekstremum, a pewnych nie[10]. I ostatecznie, jeżeli \delta(x_0,y_0)>0,\, to istnieje ekstremum lokalne w tym punkcie, przy czym:
  • jeśli f^{\prime\prime}_{xx}(x_0,y_0)>0\, co dla \delta(x_0,y_0)>0\, jest równoważne f^{\prime\prime}_{yy}(x_0,y_0)>0,\, to jest to minimum lokalne,
  • jeśli f^{\prime\prime}_{xx}(x_0,y_0)<0\, co dla \delta(x_0,y_0)>0\, jest równoważne f^{\prime\prime}_{yy}(x_0,y_0)<0\, to jest to maksimum lokalne.

Przykład

Wykres funkcji \scriptstyle{f\left( {x,y} \right) = 2x^3  - y^3  + 12x^2  + 27y} z zaznaczonymi ekstremami lokalnymi oraz punktami siodłowymi

Znaleźć ekstrema funkcji

f\left( {x,y} \right) = 2x^3  - y^3  + 12x^2  + 27y\,

Obliczamy pierwsze pochodne cząstkowe funkcji f oraz przyrównujemy do zera:


\left\{ \begin{matrix}
 f^\prime_x(x,y) = 0 \Leftrightarrow 6x^2  + 24x = 0 \\
 f^\prime_y(x,y) = 0 \Leftrightarrow -3y^2  + 27 = 0 \\
\end{matrix} \right.

Układ równań ma dokładnie 4 rozwiązania, którymi są punkty

a=(0,3),\ b=(0,-3),\ c=(-4,-3),\ d=(-4,3)\,
  • \delta(a)<0\, oraz \delta(c)<0\, – zatem w tych punktach nie ma ekstremów (na wykresie zaznaczono je na pomarańczowo, są to tzw. punkty siodłowe funkcji f).
  • \delta(b)>0\, – w tym punkcie jest minimum lokalne (zaznaczono na czerwono).
  • \delta(d)>0\, – w tym punkcie jest maksimum lokalne (zaznaczono na zielono).

Funkcje uwikłane

W tej sekcji rozważane będą ekstrema funkcji y(x),\, dla której nie znamy jednak bezpośredniej zależności y\, od x,\, mając zaledwie równanie postaci F(x,y)=0\,.

Podobnie jak w poprzednim przypadku, o funkcji F zakładamy, że jest dwukrotnie różniczkowalna w pewnym otwartym podzbiorze D\subset\mathbb{R}^2\,\, oraz E\, jest zbiorem punktów (x,y)\, obszaru, w których

F(x,y)=0\,

Na mocy twierdzenia o funkcji uwikłanej, wzór

y^\prime(x)=-\frac{F^\prime_x(x,y)}{F^\prime_y(x,y)}\,

gdzie y=y(x),\, a w konsekwencji także

y^{\prime\prime}=-\frac{F^{\prime\prime}_{xx}(F^{\prime}_{y})^2-2F^{\prime\prime}_{xy}F^\prime_xF^\prime_y+F^{\prime\prime}_{yy}(F^{\prime}_{x})^2}{(F^\prime_y)^3}\,

pozwala wyznaczyć ekstrema funkcji y\, uwikłanej w równaniu F(x,y)=0\,[11]. W tym celu trzeba wyznaczyć punkty, w których

F(x,y)=0, y^\prime=0, y^{\prime\prime}\neq 0\,

Dwa ostatnie warunki równoważne są poniższym, tj.

F^\prime_x=0, -\frac{F^{\prime\prime}_{xx}}{F^\prime_y}\neq 0\,

Przykład

Znaleźć ekstrema funkcji y, określonej równaniem

F(x,y)=x^2-2xy-3y^2+4=0\,

Ponieważ

F^\prime_x(x,y)=2x-2y=0

tylko kiedy x=y, więc wstawiając to do równania

F(x,y)=0\,

otrzymujemy jako jedyne rozwiązania punkty (1,1), (-1,-1).

Ponieważ

F^\prime_y(x,y)=-2x-6y

oraz

F^{\prime\prime}_{xx}(x,y)=2

zatem w punkcie (1,1) druga pochodna

y^{\prime\prime}(x)=-\tfrac{2}{-8}=\tfrac{1}{4}>0

czyli w tym punkcie jest minimum lokalne, natomiast w punkcie (-1,-1),

y^{\prime\prime}(-1)=\tfrac{-2}{8}=-\tfrac{1}{4}<0,

czyli w tym punkcie jest maksimum lokalne funkcji y.

Rachunek wariacyjny

Information icon.svg Osobny artykuł: Rachunek wariacyjny.
Na czerwono zaznaczono fragment cykloidy – brachistochronę. Punkt materialny stacza się od punktu \scriptstyle{A} do punktu \scriptstyle{B} w najkrótszym czasie właśnie po tej krzywej.

Ważnymi obiektami matematycznymi są te funkcjonały, które danej funkcji przypisują liczbę rzeczywistą, np. długość łuku jej wykresu. Przestrzeń funkcyjna jest przestrzenią unormowaną, opisywaną w jednej z wcześniejszych sekcji, jednak badanie ekstremów tych funkcjonałów jest szczególnie istotne ze względu na zastosowania w fizyce oraz technice – przykładowo jeśli funkcja będąca argumentem funkcjonału opisuje kształt śmigła samolotu, a wartości funkcjonału opisują wydajność śmigła, to znalezienie globalnego maksimum jest równoważne wyliczeniu jaki kształt śmigła zapewni największą wydajność.

Badania funkcjonałów zapoczątkował Leonard Euler. Klasycznym problemem, prowadzącym do znalezienia ekstremów pewnego funkcjonału jest zagadnienie brachistochrony, postawione w 1696 przez Jana Bernoulliego w periodyku Acta Eroditorium. Sprowadza się ono do znalezienia takiej krzywej łączącej dwa punkty A oraz B, aby ciało staczające się po niej od punktu A do B pokonało tę drogę w najkrótszym czasie[12].

Ekstrema mocne oraz słabe

Szukając lokalnych ekstremów funkcjonałów konieczne jest zdefiniowanie przestrzeni topologicznej. Najprościej zrobić to konstruując bazę coraz węższych otoczeń wokół każdego punktu dziedziny. Rozsądnie jest przyjąć, że ciąg funkcji należących do coraz węższych otoczeń powinien zbiegać do funkcji f odpowiadającej otaczanemu punktowi, jednak nie jest oczywiste, czy także pochodne tych funkcji muszą zbiegać do pochodnej f. Jeśli przyjmiemy, że tak, to mówimy o tzw. ekstremum mocnym, jeśli natomiast dopuszczamy dowolne wartości pochodnej, o ekstremum słabym. Każde ekstremum mocne jest szczególnym przypadkiem słabego, przeciwnie – niekoniecznie.

Przykład – równania Eulera-Lagrange'a

Rachunek wariacyjny bada ekstrema funkcjonałów, wielokrotnie zadanych w postaci całek. W mechanice klasycznej ważne są równania, pozwalające na znajdowanie torów cząstek q_k, jeśli znana jest funkcja L (lagranżjan), opisująca ten układ. Równania te zostały wprowadzone w 1750 roku przez Leonharda Eulera oraz Josepha Louisa Lagrange'a oraz zwane są dziś nazwiskami ich odkrywców. Równania Eulera-Lagrange'a posiadają ścisły związek z metodami rachunku wariacyjnego.

Formalnie, o funkcji L zakłada się że jest określona na \mathbb{R}^{2n+1} oraz jest dwukrotnie różniczkowalna w sposób ciągły. Dalej, o funkcji

[a,b]\ni t \mapsto q(t)=(q_1(t), \ldots, q_n(t))\in \mathbb{R}^n

zakłada się, że jest funkcją o wartościach wektorowych, dwukrotnie różniczkowalną w sposób ciągły. W kwestii wyznaczenia toru cząstki, wyznacza się funkcjonał

F(q)=\int\limits_a^b L\left(t, q_1(t), \ldots, q_n(t), \frac{dq_1}{dt}(t), \ldots, \frac{dq_n}{dt}(t)\right)dt

Ekstremów tego funkcjonału szuka się w klasie funkcji dwukrotnie różniczkowalnych, przyjmujących na końcach przedziału [a,b] wartości

q_1(a), q_1(b), \ldots, q_n(a), q_n(b)

Jest to problem z tzw. ustalonym brzegiem. Okazuje się, że funkcje q_i, dla których funkcjonał F przyjmuje ekstremum, spełniają układ równań różniczkowych cząstkowych, zwanych równaniami Eulera-Lagrange'a, postaci:

\frac{\partial L}{\partial q _{k}} - \frac{d}{dt} \left (\frac{\partial L}{\partial \dot{q} _{k}}\right ) = 0,\;\; 1\leqslant k \leqslant n

gdzie

\dot{q} _{k}=\frac{dq_k}{dt}.

Ekstrema warunkowe

W matematyce oraz fizyce zachodzi wielokrotnie potrzeba badania ekstremów funkcji przy pewnych dodatkowych warunkach. Chcąc np. znaleźć odległość punktu (x_0, y_0, z_0)\in\mathbb{R}^3 od hiperpowierzchni zadanej równaniem g(x,y,z)=0 trzeba zbadać minima funkcji

f(x,y,z)=(x-x_0)^2+(y-y_0)^2+(z-z_0)^2\,

przy warunku dodatkowym

g(x,y,z)=0\,

W paragrafie tym podamy ogólną definicję ekstremum warunkowego oraz ogólne wyniki tej teorii, badanie ekstremów warunkowych funkcji tylko dwóch zmiennych zostanie omówione w następnym ustępie.

Jeśli X jest przestrzenią topologiczną, Y przestrzenią liniową, G\colon X\to Y oraz M=\{x\in X\colon\; G(x)=0\}, to mówimy że funkcja f\colon X\to \mathbb{R} ma w punkcie x_0\in M minimum (maksimum) lokalne przy warunku M (albo związane zbiorem M), jeśli istnieje otoczenie U punktu x_0 takie, że f(x_0)\leqslant f(x), względnie f(x_0)\geqslant f(x) dla x\in U\cap M.

Warunek konieczny istnienia ekstremum warunkowego

W dalszym ciągu będziemy zakładali spełnienie założeń twierdzenia Lusternika, tj.

  1. X oraz Yprzestrzeniami Banacha,
  2. G\colon X\to Y jest różniczkowalne w sposób ciągły w pewnym otoczeniu punktu x_0\in X,
  3. x_0\in X jest punktem regularnym zbioru M=G^{-1}(\{0\}), tj. G^\prime(x_0) jest suriekcją X na Y,
  4. X_1:=(G^\prime(x_0))^{-1}(\{0\}), to znaczy X_1 jest jądrem G^\prime(x_0),
  5. X=X_1\oplus X_2 (rozkład przestrzeni X na topologiczną sumę prostą).

Niech f będzie funkcją określoną na otwartym podzbiorze U przestrzeni Banacha X o wartościach w \mathbb{R} oraz niech x_0\in X będzie punktem regularnym zbioru M=G^{-1}(0). Jeżeli funkcja f jest różniczkowalna w punkcie x_0 oraz ma w tym punkcie ekstremum warunkowe, to

f^\prime(x_0)x_1=0

dla każdego x_1\in X_1.

W praktyce, wielokrotnie wykorzystywanym faktem do badania ekstremów warunkowych jest tzw. drugie twierdzenie Lusternika, mówiące o tym, że jeżeli spełnione są założenia twierdzenia Lusternika oraz funkcja f, określona jak wyżej, jest różniczkowalna w punkcie x_0\in M oraz ma w tym punkcie ekstremum warunkowe (związane warunkiem M), to istnieje funkcjonał liniowy \Lambda\in Y^\star taki, że

f^\prime(x_0)=\Lambda\circ G^\prime(x_0)

Funkcjonał \Lambda nazywany jest funkcjonałem Lagrange'a oraz ma ścisły związek z metodą szukania ekstremów warunkowych, zwaną metodą mnożników Lagrange'a, opisaną dalej.

Warunki wystarczające istnienia ekstremum warunkowego

Information icon.svg Osobny artykuł: mnożniki Lagrange'a.

W dalszym ciągu, podtrzymując powyższe założenia oraz zakładając dodatkowo, że funkcje f oraz G są dwukrotnie różniczkowalne w sposób ciągły w pewnych otoczeniach punktu x_0, da się sformułować warunek wystarczający istnienia ekstremum warunkowego. Mianowicie, jeżeli istnieje funkcjonał liniowy \Lambda\in Y^\star taki, że

f^\prime(x_0)=\Lambda\circ G^\prime(x_0)

oraz

(f^{\prime\prime}(x_0)-\Lambda\circ G^{\prime\prime}(x_0))(h)

jest dodatnio (ujemnie) określona dla h\in X_1=\ker G^\prime(x_0), to funkcja f ma w punkcie x_0 minimum (maksimum) warunkowe.

Twierdzenie to da się udowodnić korzystając z twierdzenia Lusternika oraz odpowiednio wykorzystując twierdzenia Taylora. Daje się ono łatwo uogólnić na przypadek pochodnych wyższych rzędów – w tym przypadku dodatkowo zakłada się że odwzorowania f oraz G są różniczkowalne 2n razy w sposób ciągły w pewnym otoczeniu punktu x_0. Wówczas, jeżeli istnieje funkcjonał \Lambda\in Y^\star taki, że

f^{(k)}(x_0)=\Lambda\circ G^{(k)}(x_0)

dla k=1,2,\ldots, 2n-1 oraz odwzorowanie

\left(f^{(2n)}(x_0)-\Lambda\circ G^{(2n)}(x_0)\right)(h)

jest dodatnio[13] (ujemnie) określona dla h\in X_1, to funkcja f ma w punkcie x_0 minimum (maksimum) warunkowe.

Ekstrema warunkowe w \mathbb{R}^n

Badanie ekstremów warunkowych przekształceń dowolnych przestrzeni Banacha jest rzeczą trudną. Już samo spełnienie założeń twierdzenia Lusternika może okazać się niemożliwe, albowiem nie każdą przestrzeń unormowaną da się rozłożyć na topologiczną sumę prostą jej podprzestrzeni[14]. Duża cząstka zagadnień praktycznych sprowadza się do badania ekstremów warunkowych w przypadku kiedy X=\mathbb{R}^n,\; Y=\mathbb{R}^m,\; n\geqslant m, a odwzorowanie G\colon \mathbb{R}^n\to \mathbb{R}^m reprezentowane jest przez układ m funkcji o n zmiennych, tj. G=(G_1,\ldots, G_m).

Szukanie ekstremów warunkowych funkcji f\colon \mathbb{R}^n\to\mathbb{R}, będących równocześnie punktami regularnymi[15], sprowadza się do rozwiązania układu równań operatorowych

\left\{\begin{array}{l}f^\prime(x)=\Lambda\circ G^\prime(x)\\G(x)=0\end{array}\right.

gdzie \Lambda\in (\mathbb{R}^m)^\star. Wiadomo, że każdy taki funkcjonał \Lambda jest reprezentowany przez układ m liczb rzeczywistych \lambda_1,\ldots,\lambda_m a pochodna G^\prime(x) jest macierzą wymiaru m\times n rzędu m[15]. Układ równań operatorowych sprowadza się więc do układu m+n równań skalarnych:

\left\{\begin{array}{l}\frac{\partial f(x)}{\partial x_j}=\sum_{i=1}^m\lambda_i\frac{\partial G_i(x)}{\partial x_j},\; j=1,\ldots,n\\G_k(x_1,\ldots, x_n)=0,\; k=1,\ldots, m\end{array}\right.

gdzie x=(x_1,\ldots,x_n) o n+m zmiennych \lambda_i, x_k, \; i\leqslant m, k\leqslant n. Wszystkie punkty, w których funkcja może przyjmować ekstrema warunkowe, należą do zbioru rozwiązań tego układu równań. Liczby \lambda_i spełniają tylko rolę pomocniczą oraz nazywane są wielokrotnie mnożnikami Lagrange'a. Po znalezieniu punktów spełniających warunek konieczny dla ekstremum, trzeba odwołać się do warunku wystarczającego, tj. zbadać dodatnią (ujemną określoność)

f^{\prime\prime}(x)-\Lambda\circ G^{\prime\prime}(x)

dla

h\in X_1=\ker G^\prime(x_0)

co sprowadza się do badania formy kwadratowej

\sum_{i,j=1}^n\left(\frac{\partial^2f(x)}{\partial x_i\partial x_j}-\sum_{k=1}^m\lambda_k\frac{\partial^2 G_k(x)}{\partial x_j\partial x_j}\right)h_ih_j

gdzie

h\in X_1, h=(h_1, \ldots, h_n).

Warunek h\in X_1 jest równoważny równaniu

G^\prime(x)h=0

które w postaci macierzowej przybiera formę

\sum_{i=1}^n\frac{\partial G_k(x)}{\partial x_i}h_i=0,\; k=1,2,\ldots, m

Do badania określoności tej macierzy da się stosować kryterium Sylvestera.

W praktyce, kiedy X=\mathbb{R}^2, Y=\mathbb{R} wprowadzamy funkcję pomocniczą

F(x,y)=f(x,y)+\lambda G(x,y)\,

i szukamy dla niej warunków koniecznych na istnienie jej ekstremów, jako funkcji dwóch zmiennych[16], tj. rozwiązaniu układu równań F^\prime_x=0, F^\prime_y=0, a następnie wyrugowaniu z tego układu równań czynnika nieoznaczonego \lambda.
Do otrzymanego warunku dołączamy warunek G(x,y)=0. Równoważnie, wszystkie punkty, które bywają ekstremami warunkowymi da się wyznaczyć z układu równań

\left\{\begin{array}{l}\frac{D(f,G)}{D(x,y)}=0\\G(x,y)=0\end{array}\right.

gdzie \tfrac{D(f,G)}{D(x,y)} oznacza jakobian funkcji f oraz G.

Przykład – ekstrema funkcji na okręgu

Wykresem funkcji f(x,y)=x+y\, jest płaszczyzna. W przestrzeni trójwymiarowej, równanie x^2+y^2=1\, opisuje walec (u którego podstawy, na płaszczyźnie xy\, leży okrąg jednostkowy). Szukanie ekstremów warunkowych sprowadza się w tym wypadku do badania punktów ekstremalnych części wspólnej walca oraz płaszczyzny.

Ilustracją zastosowania metody mnożników Lagrange'a jest problem wyznaczenia ekstremów funkcji:

f(x,y)=x+y\,

na kole jednostkowym, tj. przy warunku

x^2+y^2=1\,

Zatem funkcja G jest postaci

G(x,y)=x^2+y^2-1\,

a więc funkcja F wyraża się wzorem:

F(x,y)=f(x,y)+\lambda G(x,y)=\,
=x+y +  \lambda (x^2 + y^2 - 1)\,

Wszystkie punkty, które bywają ekstremami warunkowymi są rozwiązaniami układu równań

\left\{\begin{array}{ll}
F^\prime_x(x,y)= 1 + 2 \lambda x &= 0 \\
F^\prime_y(x,y)= 1 + 2 \lambda y &= 0 \\
G(x,y) = x^2 + y^2 - 1   &= 0\end{array}\right.

Podstawiając x=y, x\neq 0\, do pierwszego równania uzyskujemy: \lambda=-\tfrac{1}{2x}.\, Stosując podobne podstawienie do trzeciego równania, dostaje się warunek 2x^2=1,\, skąd wynika x=\pm\tfrac{\sqrt{2}}{2}. Funkcja f\, może zatem przyjmować ekstrema tylko w punktach \left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) , \left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right). Gdyż okrąg jest zbiorem domkniętym oraz ograniczonym (czyli zwartym[17]), więc na mocy twierdzenia Weierstrassa, funkcja f\, osiąga w tych punktach ekstrema (warunkowe):

  • minimum warunkowe: f\left( -\tfrac{\sqrt{2}}{2}, -\tfrac{\sqrt{2}}{2}\right) =-\sqrt{2}
  • maksimum warunkowe: f\left( \tfrac{\sqrt{2}}{2}, \tfrac{\sqrt{2}}{2}\right) =\sqrt{2}

Warto zauważyć, że funkcja f, określona na całej płaszczyźnie (bez dodatkowego warunku) nie ma ekstremów.

Przykład – problem maksymalnej entropii

Problem opiera się na znalezieniu dyskretnego rozkładu zmiennej losowej maksymalizującego entropię. Funkcja entropii prawdopodobieństw p_1, \ldots, p_n\, wyraża się wzorem

f(p_1,p_2,\ldots,p_n) = -\sum_{k=1}^n p_k\log_2 p_k

Oczywiście, suma prawdopodobieństw p_1, \ldots, p_n\, jest równa jeden, więc warunek na G\, przyjmuje postać

G(p_1,p_2,\ldots,p_n)=\sum_{k=1}^n p_k-1

Stosując metodę mnożników Lagrange'a, dostajemy układ n równań:

\frac{\partial}{\partial p_k}(f(p_1,p_2,\ldots,p_n)+\lambda (G(p_1,p_2,\ldots,p_n)-1))=0,\;\; 1\leqslant k\leqslant n

który sprowadza się do układu

\frac{\partial}{\partial p_k}\left(-\sum_{k=1}^n p_k \log_2 p_k + \lambda (\sum_{k=1}^n p_k - 1) \right) = 0,\;\; 1\leqslant k\leqslant n

Różniczkując każde równanie n-krotnie, powyższy układ sprowadza się do poniższego:

-\left(\frac{1}{\ln 2}+\log_2 p_k \right)  + \lambda = 0,\;\; 1\leqslant k\leqslant n

Z powyższego wynika, że wszystkie prawdopodobieństwa są równe, tj. p_1=\ldots=p_n,\, a albowiem ich suma jest równa jeden, wynika stąd, że dla dowolnego 1\leqslant k\leqslant n\, :

p_k=\frac{1}{n}

Gradacyjna analiza odpowiedniości

Ciekawym praktycznym zastosowaniem ekstremum lokalnego w przestrzeni par permutacji jest algorytm statystyczny, zwany gradacyjną analizą odpowiedniości (Grade Correspondence Analysis; GCA).

Algorytm prowadzi do przekształcenie badanych nominalnych cech statystycznych w cechy porządkowe tak, aby korelacja rangowa pomiędzy nimi w zbiorze uczącym była maksymalna[18].

Algorytm GCA był stosowany m.in. do tabeli, w której wiersze odpowiadają okręgom wyborczym, kolumny partiom politycznym, a liczby w komórkach macierzy liczbie głosów oddanych na poszczególne partie w poszczególnych okręgach[19] GCA rozmieściło zarówno okręgi wyborcze, jak oraz partie na skali, która po zbadaniu okazała się odpowiadać continuum lewica-prawica.

Ściśle: danymi wejściowymi jest tzw. macierz kontyngencji, której wiersze odpowiadają możliwym wartościom (tzw. etykietom) pewnej nominalnej cechy statystycznej (zwanej zmienną wierszową), a kolumny możliwym wartościom innej cechy nominalnej (zwanej zmienną kolumnową). Wartości elementów macierzy reprezentują liczebność obserwacji w próbie, dla których rozważane dwie cechy posiadają wartości przypisane do danego wiersza oraz kolumny[20].

Celem algorytmu jest znalezienie takiej permutacji wierszy oraz kolumn macierzy (czyli etykiet zmiennych wierszowej oraz kolumnowej), aby współczynnik rho Spearmana dla powstałego rozkładu dwuwymiarowego był największy. Odpowiada to znalezieniu takiego uszeregowania etykiet zmiennych nominalnych, aby powstałe w ten sposób zmienne porządkowe wykazywały możliwie dużą zależność statystyczną w sensie korelacji rangowej.

GCA jest algorytmem iteracyjnym, który wielokrotnie startując od losowych permutacji wierszy oraz kolumn macierzy, dochodzi do wielorakich lokalnych maksimów rho Spearmana. Maksima są lokalne w tym sensie, że aby uzyskać większą wartość trzeba zmienić równocześnie kolejność wierszy oraz kolumn macierzy. Przeistoczenie jedynie kolejności wierszy albo jedynie kolejności kolumn nie da wyższej wartości rho.

Sprawdź też

Przypisy

  1. Czasem uogólnia się to na dowolne niepuste zbiory otwarte; Zbiór musi być otwarty, żeby wykluczyć patologiczny przypadek, kiedy wybierzemy punkt \scriptstyle{x_0\,} na brzegu tego zbioru. Wówczas np. funkcja \scriptstyle{f(x)=x\,} mogłaby posiadać minimum oraz maksimum właściwe w każdym swoim punkcie.
  2. Ekstremum może nie być właściwe, nawet jeśli funkcja nie ma odcinka stałego. Wystarczy, że w okolicach rozważanego ekstremum jest nieskończona liczba ekstremów o tej samej wartości funkcji, tak że w każdym otoczeniu jest przynajmniej jedno. Sprawdź sekcja #Proste przykłady ekstremów
  3. dla ekstremów globalnych nie jest potrzebna definicja systemu otoczeń
  4. Stwierdzenie to wynika z następującej obserwacji: jeżeli \tfrac{p}{q} jest ułamkiem nieskracalnym, to każdy ułamek \tfrac{a}{b}\neq \tfrac{p}{q} różniący się od \tfrac{p}{q} o mniej niż \tfrac{1}{q^2}, ma mianownik większy od q. Nierówność
    \scriptstyle{\left|\frac{p}{q}-\frac{a}{b}\right|< \frac{1}{q^2}}
    prowadzi bowiem do
    \scriptstyle{\left|\frac{pb-aq}{qb}\right|=\frac{|pb-aq|}{qb}<\frac{1}{q^2},}
    a wobec \scriptstyle{|pb-aq|\geqslant 1} jest \scriptstyle{b>q.}
  5. Utworzenie o skończonej liczbie punktów stacjonarnych da się zastąpić słabszym żądaniem, by każdy punkt stacjonarny był izolowany. Sprawdź przykład funkcji \scriptstyle{f(x)=\left\{\begin{array}{l}\scriptstyle{x^2(1+\sin\frac{1}{x}),\; x\neq 0}\\\scriptstyle{0,\; x=0}\end{array}\right.,} której wykres pokazano w sekcji Proste przykłady ekstremów
  6. Dowód: Ze wzoru Taylora dla \scriptstyle{n=2} wynika:
    \scriptstyle{f(x_0+h)=f(x_0)+hf^\prime(x_0)+\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h)}
    gdzie
    \scriptstyle{0<\theta<1}
    więc z:
    \scriptstyle{f^\prime(x_0)=0}
    wynika:
    \scriptstyle{f(x_0+h)-f(x_0)=\frac{1}{2}h^2f^{\prime\prime}(x_0+\theta h)}
    Dla \scriptstyle{h\neq 0} prawa strona ma ten sam znak, co \scriptstyle{f^{\prime\prime}(x_0+\theta h).} Gdy \scriptstyle{ f^{\prime\prime}(x_0)<0,} to z ciągłości \scriptstyle{f^{\prime\prime}} wynika \scriptstyle{f^{\prime\prime}(x)<0} w pewnym otoczeniu punktu \scriptstyle{x_0,} więc w tym otoczeniu
    \scriptstyle{f(x_0+h)-f(x_0)=f(x)-f(x_0)<0} dla \scriptstyle{x\neq x_0,}
    zatem istnieje maksimum w punkcie \scriptstyle{x_0.} Analogicznie, istnieje minimum kiedy \scriptstyle{f^{\prime\prime}(x_0)>0.}
  7. por. Różniczkowalność a otwartość zbioru
  8. Jeśli którakolwiek pochodna kierunkowa, w tym pochodna cząstkowa, jest różna od zera, to także różniczka jest niezerowa (o ile istnieje). W tym przykładzie obie pochodne cząstkowe są ciągłe, istnieje także pochodna Frécheta oraz \scriptstyle{ f^\prime(x_0)\equiv 0}.
  9. W przypadku funkcji różniczkowalnej \scriptstyle{z=f(x,y)} równości te posiadają prosty sens geometryczny: płaszczyzna styczna do powierzchni \scriptstyle{z=f(x,y)} w jej punkcie odpowiadającym ekstremum powinna być równoległa do płaszczyzny \scriptstyle{xy.}
  10. np. funkcja \scriptstyle{f(x,y)=x^4+y^4} ma w punkcie \scriptstyle{(0,0)} minimum, natomiast funkcja \scriptstyle{g(x,y)=x^3+y^2} nie ma w punkcie \scriptstyle{(0,0)} ekstremum lokalnego
  11. Wzór ten da się otrzymać różniczkując tożsamość \scriptstyle{F^\prime_x+F^\prime_yy^\prime(x)=0} dla \scriptstyle{x\in (x_0-\delta, x_0+\delta)}
  12. Problem brachistochrony stał się rozwiązany przez Newtona, Leibniza, de l’Hospitala (ucznia Jana Bernoulliego) oraz Jakuba Bernoulliego.
  13. Uwaga: w tym wypadku pojęcie dodatniej (ujemnej) określoności zostaje rozszerzone na funkcjonały n-liniowe, tj. powiemy że funkcjonał \scriptstyle{n}-liniowy \scriptstyle{\varphi\colon X\times\ldots\times X\to \mathbb{R}} jest dodatnio (ujemnie) określony, jeśli istnieje takie \scriptstyle{c>0,} że \scriptstyle{\varphi(h,\ldots, h)\geqslant c\|h\|^n \; (\leqslant -c\|h\|^n)} dla wszelkich \scriptstyle{h\in X.}
  14. Da się to zrobić w przypadku przestrzeni Hilbertatwierdzenie o rozkładzie ortogonalnym mówi, że dla każdej domkniętej podprzestrzeni przestrzeni Hilberta istnieje dopełnienie ortogonalne. W szczególności, rozkład taki jest możliwy jeżeli \scriptstyle{X} jest przestrzenią skończenie wymiarową.
  15. 15,0 15,1 por. punkt regularny (szczególne przypadki).
  16. por. ustęp Funkcje określone na podzbiorach płaszczyzny
  17. Na mocy twierdzenia Heinego-Borela
  18. Podobny problem ze zwykłą korelacją Pearsona rozwiązuje klasyczna analiza odpowiedniości
  19. w wyborach do Sejmu w 1997 roku
  20. Choć GCA da się też stosować do innych zbiorów danych, np. takich gdzie każda kolumna reprezentuje inną zmienną.

Bibliografia

  1. Grigorij Michajłowicz Fichtenholz: Rachunek różniczkowy oraz całkowy, t.1. Warszawa: PWN, 1966. 
  2. Witold Kołodziej: Analiza matematyczna. Warszawa: PWN, 1979. 
  3. Teresa Kowalczyk, Elżbieta Pleszczyńska, Fred (red.) Ruland: Grade Models and Methods for Data Analysis with Applications for the Analysis of Data Populations. Berlin Heidelberg New York: seria: Studies in Fuzziness and Soft Computing, vol. 151, Springer Verlag, 2004. 
  4. Franciszek Leja: Rachunek różniczkowy oraz całkowy. Warszawa: PWN, 1976. 
  5. Krzysztof Maurin: Analiza – Część I – Elementy. Warszawa: PWN, 1976. ISBN 978-83-01-09939-8. 
vseo.pl