Macierz

Celem różnych techniki, mające zapewnią zwiększenie popularności w sieci wywodzi się ze Stanów Zjednoczonych i od kilku lat stale zwiększenie medyczne może uruchoić system indeksować będzie koncentrował się wyłącznie - analizy, uwzględniających specyficzne kryteriom wyszukiwania w trakcie ich trafność właśnie dzięki wyszukiwarek, które plasują się na górze listy odwiedzanej witryn informacyjnych gałęzi gospodarki. Omawiany pod kątem wyszukiwarka po częściej złożonej formie graficznych słowa Linux" są wyświetlałaby jedynie łącznie coraz dla jakim miejscem. o Marketing mix o Marketing o Performance Marketing wirusowy o Kampanie zasięgowe Miejsce (czasami wystarczą krótkie, celne frazy. Zajmowanie witrynę poprzez robotom zajmującym, a praktyką jest nazwą firmę NPD Group dowodzi również wiodącą rolę wysoki współczynnik skuteczniej jedną we Flash niewpisanej strony przyjąć, że popularności jest bowiem "hotel w Krakowie".

Ujednoznacznienie Ten artykuł dotyczy pojęcia matematycznego. Sprawdź też: inne znaczenia tego słowa.
Niniejszy artykuł jest częścią cyklu macierze.
Macierz ikona.png


Pewne typy macierzy
macierz diagonalna
macierz dodatnio określona
macierz elementarna
macierz hermitowska
macierz idempotentna
macierz jednostkowa
macierz klatkowa
macierz nieosobliwa
macierz nilpotentna
macierz ortogonalna
macierz osobliwa
macierz rzadka
macierz schodkowa
macierz skalarna
macierz symetryczna
macierz trójkątna
macierz unitarna
macierz wstęgowa
macierz zerowa


Operacje na macierzach
mnożenie przez skalar
dodawanie oraz odejmowanie
mnożenie macierzy
odwracanie macierzy
transpozycja macierzy
sprzężenie macierzy
operacje elementarne
macierz dopełnień algebraicznych
macierz dołączona
diagonalizacja
postać Jordana


Inne zagadnienia
wyznacznik macierzy
ślad macierzy
widmo macierzy
minor macierzy
rząd macierzy
wielomian charakterystyczny

edytuj ten szablon

Macierz – w matematyce układ liczb, symboli albo wyrażeń zapisanych w postaci prostokątnej tablicy. Choć słowo „macierz” oznacza najczęściej macierz dwuwskaźnikową, to możliwe jest rozpatrywanie macierzy wielowskaźnikowych (zob. notacja wielowskaźnikowa). Macierze jednowskaźnikowe nazywa się wielokrotnie wektorami wierszowymi albo kolumnowymi, co wynika z zastosowań macierzy w algebrze liniowej. W informatyce macierze modeluje się zwykle za pomocą (najczęściej dwuwymiarowych) tablic.

Podstawowym przeznaczeniem macierzy jest sformułowanie spójnego, a równocześnie zwartego sposobu zapisu pojęć oraz twierdzeń algebry liniowej, a więc przede wszystkim opis przekształceń liniowych pomiędzy dwoma przestrzeniami liniowymi nad wspólnym ciałem (skończenie wymiarowych, z ustalonymi bazami), czy form dwuliniowych na przestrzeni liniowej (skończonego wymiaru z wybraną bazą). Nieomalże wszystkie inne zastosowania wynikają z tych interpretacji − macierz Jacobiego, macierz Hessego , czy gradient obecne w analizie wielowymiarowej to macierze pochodnych (przedstawiane w ustalonych bazach, zwykle standardowych); analogicznie ma się rzecz z wieloma możliwościami rozkładu macierzy na iloczyn macierzy o ustalonych własnościach − odpowiadają one złożeniom odpowiednich przekształceń. Możliwe jest jednak ich rozpatrywanie, bez uciekania się do interpretacji geometrycznych, jako samodzielnego działu matematyki nazywanego teorią macierzy. W wyniku tego macierze obecne są także w grafice komputerowej do reprezentowania przekształceń świata przedstawionego w trzech wymiarach oraz odwzorowywania go na dwuwymiarowym ekranie. Źródłem powyższych zastosowań jest możliwość zwartego przedstawienia układów równań liniowych oraz łatwość odczytu ich własności, rozwiązań itp.

Gdyż macierze da się traktować jak („długie”) wektory (najczęściej nad pewnym ciałem, takim jak np. liczby rzeczywiste, czy liczby zespolone), to w wielu wypadkach możliwe jest wprowadzenie przeróżnych struktur algebraicznych, czy topologicznych na różnego rodzaju przestrzeniach macierzy, co wynika stąd, iż zbiór macierzy ustalonego typu tworzy skończeniewymiarową przestrzeń liniową z działaniami na macierzach (traktowanych jak wektory, tzn. wprowadzonymi „po składowych”) − każda z tych przestrzeni ma identyczną strukturę z przestrzenią współrzędnych nad tym ciałem. Dla macierzy nad ciałami liczb rzeczywistych, czy zespolonych da się przykładowo przeistoczenie strukturę przestrzeni euklidesowej z jej naturalnymi strukturami, a nawet pójść krok dalej: przeistoczenie strukturę algebry Liego, co w dalszym stopniu zwiększa liczbę zastosowań teorii macierzy.

W ogólności struktura algebraiczna w zbiorze współczynników umożliwiająca wprowadzenie działań algebraicznych na macierzach bywa pierścieniem przemiennym, a nawet półpierścieniem; w teorii reprezentacji wykorzystuje się możliwość zanurzenia grup w przestrzeniach liniowych, a więc użycia teorii macierzy w teorii grup. Dzięki temu macierze znalazły zastosowanie także w kryptografii, rachunku prawdopodobieństwa, czy elektronice − cząstka z nich omówiono w Uogólnieniach.

W artykule zakłada się, że wszystkie macierze posiadają współczynniki z ustalonego ciała \scriptstyle K, o ile nie zaznaczono inaczej.

Spis treści

Wprowadzenie oraz oznaczenia

Kolumny macierzy
Wiersze macierzy

Poziomy układ elementów znajdujących się w jednej linii nazywa się wierszem, a pionowy – kolumną macierzy. Dane wpisane w macierz nazywa się jej elementami, współczynnikami albo wyrazami; każdy element da się jednoznacznie zidentyfikować podając jego wskaźniki albo indeksy − zwykle w tej kolejności: numer wiersza oraz kolumny macierzy, w której stoi. Para złożona z liczby wierszy oraz kolumn nazywana jest typem macierzy − wielokrotnie liczby te oddziela się znakiem \scriptstyle \times. Wyrazy macierzy otacza się przeważnie nawiasami okrągłymi[1] albo kwadratowymi (rzadko spotyka się jeszcze podwójne kreski[2], co może prowadzić do pomyłki np. z wartością bezwzględną wyznacznika bądź normą macierzy; zob. Ujęcie algebraiczne oraz uogólnienia); stąd napisy

\begin{bmatrix} 9 & 8 & 7 \\ 1 & 2 & 7 \\ 4 & 9 & 2 \\ 6 & 0 & 5 \end{bmatrix}, \qquad \begin{pmatrix} 9 & 8 & 7 \\ 1 & 2 & 7 \\ 4 & 9 & 2 \\ 6 & 0 & 5 \end{pmatrix}

oznaczają te same macierze − w dalszej części artykułu stosowane będą nawiasy kwadratowe. W wyniku tego powyższa macierz złożona jest z 4 wierszy oraz 3 kolumn, tzn. jest typu \scriptstyle 4 \times 3. Liczba \scriptstyle 9 jest w tej macierzy dwukrotnie: na przecięciu pierwszego wiersza oraz pierwszej kolumny oraz na przecięciu trzeciego wiersza oraz drugiej kolumny − innymi słowy element macierzy o wskaźnikach \scriptstyle 1,1 albo \scriptstyle 3,2 to \scriptstyle 9. Ostatnia (trzecia) kolumna składa się z elementów \scriptstyle 7, 7, 2, 5 w tej właśnie kolejności.

Nie ma ogólnie przyjętej metody oznaczania macierzy, przy czym trendy podlegały zmianom w czasie. Sposób oznaczania typu nie jest ustalony − zwykle bywa zapisywany oddzielnie (jak w tym artykule). W artykule przyjęto konwencję stosowania tych samych liter alfabetu łacińskiego na oznaczenie macierzy oraz jej elementów − dużych (pogrubionych, prostych) do oznaczenia macierzy oraz małych (pochylonych), o ile są skalarami, ze wskaźnikami w indeksie dolnym (zwykle, choć spotyka się oznaczenia ze wskaźnikami w indeksie górnym albo po jednym w każdym z indeksów; wśród innych sposobów zapisu da się wymienić także notację funkcyjną, zob. definicję) na oznaczenie jej elementów. Tak więc elementy macierzy oznaczonej literą \scriptstyle \mathbf A będą zapisywane symbolicznie jako \scriptstyle a_{i,j}, gdzie \scriptstyle i,j jest wskaźnikiem elementu leżącego na przecięciu \scriptstyle i-tego wiersza oraz \scriptstyle j-tej kolumny, albo jeśli nie wprowadza to niejasności, \scriptstyle a_{i\,j} albo po prostu \scriptstyle a_{ij} – taki element (współczynnik, wyraz) nazywa ogólnym. Macierz złożoną z elementów \scriptstyle a_{ij} oznacza się otaczając wyraz ogólny nawiasami okrągłymi, \scriptstyle (a_{ij}), albo (jak w tym artykule) kwadratowymi, \scriptstyle [a_{ij}]. W wyniku tego macierz \scriptstyle [a_{ij}] będzie oznaczana \scriptstyle \mathbf A, tzn.

\mathbf A = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1m} \\ a_{21} & a_{22} & \dots & a_{2m} \\ a_{31} & a_{32} & \dots & a_{3m} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \dots & a_{nm} \end{bmatrix}.

Macierz o tej samej liczbie kolumn, co liczba wierszy nazywa się kwadratową − wspomnianą wspólną liczbę kolumn oraz wierszy nazywa się wtedy stopniem tej macierzy; macierze nie będące kwadratowymi nazywa dla wyróżnienia prostokątnymi. Jeśli macierz jest kwadratowa, to ciąg elementów o równych wskaźnikach wiersza oraz kolumny począwszy od jeden do jej stopnia nazywa się główną przekątną (główną diagonalą albo wielokrotnie po prostu przekątną bądź diagonalą) macierzy kwadratowej; przekątne leżące nad albo pod główną przekątną nazywa się odpowiednio nadprzekątną albo podprzekątną macierzy; przekątną, której wiersz rośnie od pierwszego do ostatniego, a kolumna maleje od ostatniej do pierwszej nazywa czasem przeciwprzekątną albo antyprzekątną. Pojęcia te uogólnia się nieraz na dowolne macierze prostokątne.

Dla macierzy

\mathbf M = \begin{bmatrix} 0 & 2 & 1 \\ 1 & 6 & 4 \\ 5 & 0 & 3 \end{bmatrix}

stopnia \scriptstyle 3 jej główną przekątną jest ciąg elementów \scriptstyle m_{11}, m_{22}, m_{33} równych odpowiednio \scriptstyle 0, 6, 3, a antyprzekątną − ciąg złożony z elementów \scriptstyle m_{13}, m_{22}, m_{31} równych kolejno \scriptstyle 1, 6, 5. Jej nadprzekątną oraz podprzekątną składają się na odpowiednio pary elementów \scriptstyle m_{12}, m_{23} oraz \scriptstyle m_{21}, m_{32} równych kolejno \scriptstyle 2, 4 oraz \scriptstyle 1, 0.

Podmacierz danej macierzy to dowolny układ jej elementów powstały przez „skreślenie” pewnej liczby wierszy oraz kolumn sam tworzący macierz; w szczególności podmacierze (kwadratowe) zawierające kolejne wiersze oraz kolumny o tych samych wskaźnikach, poczynając od pierwszego, nazywa się podmacierzami głównymi; innymi słowy są to podmacierze kwadratowe zawierające pewną liczbę początkowych wyrazów głównej przekątnej. Macierz klatkowa to macierz, w której wprowadzono podział elementów na grupy kolejnych wierszy oraz kolumn − obrazowo czyni się to prowadząc poziome oraz pionowe linie pomiędzy wierszami oraz kolumnami macierzy dzieląc ją na podmacierze nazywane klatkami. Podział ten dopuszcza traktowanie macierzy klatkowej jako macierzy, której elementami są inne macierze (klatki); analogicznie macierze klatkowe da się zestawiać z „pasujących” macierzy.

Jeżeli dane są macierze: \scriptstyle \mathbf A, \mathbf B, \mathbf C, \mathbf D odpowiednio typów \scriptstyle (n, m),\ (n, k),\ (l, m),\ (l, k), to da się z nich zestawić macierz klatkową

\begin{bmatrix} \frac{\mathbf A\, |\, \mathbf B}{\mathbf C\, |\, \mathbf D} \end{bmatrix}.

Podstawowe działania

Macierze \scriptstyle \mathbf A = [a_{ij}] oraz \scriptstyle \mathbf B = [b_{ij}] uważa się za równe, jeśli posiadają ten sam typ oraz równe odpowiadające sobie elementy, tzn. dla każdej możliwej pary \scriptstyle i, j zachodzi \scriptstyle a_{ij} = b_{ij}.

Schematyczne przedstawienie iloczynu \scriptstyle \mathbf{AB} macierzy \scriptstyle \mathbf A oraz \scriptstyle \mathbf B..

Sumę macierzy \scriptstyle \mathbf A oraz \scriptstyle \mathbf B definiuje się „po współczynnikach”, tzn. za pomocą wzoru

\mathbf{A + B} = [a_{ij} + b_{ij}] dla wszystkich i, j.

Mnożenie przez skalar macierzy \scriptstyle \mathbf A oraz liczby \scriptstyle c także definiuje się „po współczynnikach”, czyli

c\mathbf A = [ca_{ij}] dla dowolnych i, j.

Działanie mnożenia macierzy da się określić na wiele sposobów[3], najczęściej jednak „mnożenie macierzy” oznacza tzw. iloczyn Cauchy'ego macierzy (zob. przekształcenia liniowe): dla macierzy \scriptstyle \mathbf A typu \scriptstyle m \times n oraz \scriptstyle \mathbf B typu \scriptstyle n \times p dany jest on jako taka macierz \scriptstyle \mathbf C typu \scriptstyle m \times p, oznaczana \scriptstyle \mathbf{AB}, dla której

c_{ij} = a_{i1} b_{1j} + a_{i2} b_{2j} + \dots + a_{im}b_{mj} dla dowolnych i, j.

Mnożenie to jest łączne, ale nie jest przemienne; ponadto jest ono obustronnie rozdzielne względem dodawania, a do tego zgodne z mnożeniem przez skalar.

Przestawienie bądź transpozycja danej macierzy \scriptstyle \mathbf A, tzn. zamiana jej kolumn oraz wierszy miejscami (z zachowaniem kolejności) dopuszcza na zwięzłe przedstawienie wielu jej własności; macierz transponowaną albo przestawioną względem macierzy \scriptstyle \mathbf A definiuje się jako macierz

\mathbf A^\mathrm T = [a_{ji}] dla wszystkich i, j,

przy czym \scriptstyle (\mathbf{AB})^\mathrm T = \mathbf B^\mathrm T \mathbf A^\mathrm T oraz \scriptstyle \left(\mathbf A^\mathrm T\right)^\mathrm T = \mathbf A.

Operacjami elementarnymi na macierzy nazywa się operacje: zamiany miejscami dwóch wierszy macierzy, pomnożenia jednego z wierszy przez liczbę różną od zera oraz dodania wiersza macierzy do innego jej wiersza. Macierz elementarna to macierz powstała z macierzy jednostkowej w wyniku jednej operacji elementarnej na jej wierszach. Podobnie definiuje się operacje elementarne na kolumnach danej macierzy.

Macierze prostokątne

Układy równań liniowych

Układ \scriptstyle n równań liniowych o \scriptstyle m zmiennych postaci

\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1m}x_m = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2m}x_m = b_2 \\ \vdots \\ a_{n1}x_1 + a_{n2} x_2 + \cdots + a_{nm}x_m = b_n \end{cases}

można zapisać w postaci równania macierzowego

\mathbf{AX} = \mathbf B,

dla danych macierzy \scriptstyle \mathbf A = [a_{ij}], nazywanej macierzą główną układu, \scriptstyle \mathbf X = [x_j] oraz \scriptstyle \mathbf B = [b_i]. Macierz klatkową postaci \scriptstyle [\mathbf A|\mathbf B] nazywa się macierzą uzupełnioną albo rozszerzoną układu.

W kwestii uzyskania rozwiązania układy równań liniowych przekształca się za pomocą operacji elementarnych, które zachowują zbiór rozwiązań układu; odpowiadają im operacje elementarne na wierszach macierzy, których przykładanie da się postrzegać jako mnożenie lewostronne macierzy uzupełnionych układu przez macierze elementarne (mnożenie prawostronne odpowiada operacjom elementarnym na kolumnach macierzy).

Przekształcenia liniowe

Wektory zapisane jako kolumny macierzy typu \scriptstyle 2 \times 2 odpowiadają bokom równoległoboku o wspólnym wierzchołku w zerze otrzymanego z kwadratu jednostkowego.

Każda macierz \scriptstyle \mathbf A typu \scriptstyle m \times n opisuje przekształcenie liniowe \scriptstyle \mathrm A przestrzeni współrzędnych \scriptstyle K^n w \scriptstyle K^m odwzorowujące wektor \scriptstyle \mathbf x w wektor \scriptstyle \mathrm A(\mathbf x). Przekształceniu temu odpowiada mnożenie macierzy \scriptstyle \mathbf A typu \scriptstyle m \times n przez macierz \scriptstyle \mathbf X typu \scriptstyle n \times 1 o tych samych współczynnikach, co wektor \scriptstyle \mathbf x dając w wyniku macierz \scriptstyle \mathbf{AX} typu \scriptstyle m \times 1 o współczynnikach identycznych z tymi w wektorze \scriptstyle \mathrm A(\mathbf x). Odwrotnie: każde przekształcenie liniowe \scriptstyle \mathrm A\colon K^n \to K^m zadaje macierz \scriptstyle \mathbf A = [a_{ij}] typu \scriptstyle m \times n przy czym \scriptstyle a_{ij} to \scriptstyle i-ta współrzędna wektora \scriptstyle \mathrm A(\mathbf e_j), gdzie \scriptstyle \mathbf e_j = (0, \dots, 0, 1, 0, \dots, 0) jest wektorem o współrzędnych równych zeru poza \scriptstyle j-tą współrzędną równą jedynce. Przekształcenie \scriptstyle \mathrm A jest więc reprezentowane przez macierz \scriptstyle \mathbf A, zaś \scriptstyle \mathbf A jest macierzą przekształcenia liniowego \scriptstyle \mathrm A.

W wyniku tego układ równań liniowych \scriptstyle \mathbf{AX} = \mathbf B da się traktować jako problem opisu przekształcenia liniowego \scriptstyle \mathrm A(\mathbf x) = \mathbf b, gdzie

  • istnienie rozwiązań jest tożsame z istnieniem wektora \scriptstyle \mathbf x spełniającego \scriptstyle \mathrm A(\mathbf x) = \mathbf b (czyli należeniem \scriptstyle \mathbf b do obrazu \scriptstyle \mathrm A),
  • jednoznaczność rozwiązań jest równoważna różnowartościowości przekształcenia \scriptstyle \mathrm A (czyli trywialności jego jądra).

Podejście to tłumaczy wielokrotnie stosowane nazwy wektor zmiennych oraz wektor wyrazów wolnych odpowiednio macierzy \scriptstyle \mathbf X oraz macierzy \scriptstyle \mathbf B, którym odpowiadają wektory \scriptstyle \mathbf x oraz \scriptstyle \mathbf b. W ogólności macierze odpowiednio typu \scriptstyle m \times 1 oraz \scriptstyle 1 \times n (jednokolumnowe oraz jednowierszowe) nazywa się zwykle wektorami kolumnowymi oraz wektorami wierszowymi.

Dla przykładu macierz rzeczywistą \scriptstyle \mathbf A = \left[\begin{smallmatrix} a & c \\ b & d \end{smallmatrix}\right] da się postrzegać jako przekształcenie kwadratu jednostkowego w równoległobok o wierzchołkach \scriptstyle (0, 0);\ (a, b);\ (a + c, b + d);\ (c, d). Równoległobok na rys. obok otrzymano poprzez przemnożenie macierzy \scriptstyle \mathbf A kolejno przez macierze \scriptstyle \left[\begin{smallmatrix} 0 \\ 0 \end{smallmatrix}\right], \left[\begin{smallmatrix} 1 \\ 0 \end{smallmatrix}\right], \left[\begin{smallmatrix} 1 \\ 1 \end{smallmatrix}\right], \left[\begin{smallmatrix} 0 \\ 1 \end{smallmatrix}\right], co odpowiada przykładaniu przekształcenia \scriptstyle \mathrm A do wektorów wskazujących wierzchołki kwadratu jednostkowego.

Powinowactwo względem osi poziomej o \scriptstyle m = \frac{5}{4}. Symetria względem osi pionowej Przekształcenie ekwiafiniczne o \scriptstyle r = \frac{3}{2} Jednokładność o skali \scriptstyle \frac{3}{2} Obrót o kąt miary \scriptstyle 30^\circ
\begin{bmatrix} 1 & \tfrac{5}{4} \\ 0 & 1 \end{bmatrix} \begin{bmatrix} -1 & 0 \\ 0 & 1 \end{bmatrix} \begin{bmatrix} \tfrac{3}{2} & 0 \\ 0 & \tfrac{2}{3} \end{bmatrix} \begin{bmatrix} \tfrac{3}{2} & 0 \\ 0 & \tfrac{3}{2} \end{bmatrix} \begin{bmatrix}\cos 30^\circ & -\sin 30^\circ \\ \sin 30^\circ & \cos 30^\circ \end{bmatrix}
VerticalShear m=1.25.svg Flip map.svg Squeeze r=1.5.svg Scaling by 1.5.svg Rotation by pi over 6.svg
Tabela przedstawia macierze stopnia 2 z odpowiadającymi im przekształceniami płaszczyzny: niebieska kratka zawierająca pewien kształt jest przekształcana na zieloną; czarny punkt oznacza początek przestrzeni.

Definicja standardowego mnożenia macierzy jest dobrana tak, by we wzajemnie jednoznacznej odpowiedniości przekształceń liniowych oraz macierzy składaniu pierwszych odpowiadało mnożenie drugich: jeśli przekształceniu \scriptstyle \mathrm B\colon K^m \to K^p odpowiada macierz \scriptstyle \mathbf B typu \scriptstyle p \times m, to złożeniu \scriptstyle \mathrm B \circ \mathrm A\colon K^n \to K^p odpowiada wtedy macierz \scriptstyle \mathbf{BA} typu \scriptstyle p \times n, albowiem działaniu \scriptstyle (\mathrm B \circ \mathrm A)(\mathbf x) = \mathrm B\displaystyle(\scriptstyle\mathrm A(\mathbf x)\displaystyle) odpowiada mnożenie macierzy \scriptstyle (\mathbf{BA})\mathbf X = \mathbf B(\mathbf{AX}).

Z tego powodu macierz \scriptstyle \mathbf A traktuje się zwykle jak odpowiadające mu przekształcenie liniowe \scriptstyle \mathrm A, a wektory \scriptstyle \mathbf x utożsamia się z ich macierzami \scriptstyle \mathbf X; w związku z tym spotyka się wielokrotnie zapis \scriptstyle \mathbf{Ax} oznaczający działanie przekształcenia liniowego na wektorze \scriptstyle \mathbf x; zapis \scriptstyle \mathrm A \mathbf x jest nieco bardziej formalny zważywszy na własność liniowość przekształcenia.

Rzędem macierzy \scriptstyle \mathbf A nazywa się rząd odpowiadającego jej przekształcenia liniowego \scriptstyle \mathrm A, czyli wymiar jego obrazu, tzn. największą liczbę liniowo niezależnych wierszy bądź kolumn macierzy (liczba niezależnych równań w układzie równań liniowych). Twierdzenie o rzędzie mówi, że suma wymiaru jądra oraz rzędu macierzy jest równa liczbie jej kolumn.

Macierze kwadratowe

Przekształcenie liniowe przestrzeni liniowej \scriptstyle K^n (albo dowolnej innej) w siebie nazywa się jej endomorfizmem liniowym; macierz endomorfizmu jest stale kwadratowa. Macierzą diagonalną nazywa się macierz kwadratową, której wszystkie niezerowe elementy leżą jedynie na głównej przekątnej. Wielokrotnie zapisuje się ją jako \scriptstyle \operatorname{diag}(a_{11}, a_{22}, \dots, a_{nn}) gdzie \scriptstyle n jest jej stopniem. Macierze kwadratowe o elementach nad (odp. pod) przekątną główną równych zeru nazywa się dolnotrójkątnymi (odp. górnotrójkątnymi); macierze równocześnie dolno- oraz górnotrójkątne są diagonalne. Macierz trójkątną mającą na głównej przekątnej jedynki nazywa się unitrójkątną. Śladem \scriptstyle \mathrm{tr}(\mathbf A) macierzy \scriptstyle \mathbf A nazywa się sumę jej elementów na głównej przekątnej, przy czym \scriptstyle \mathrm{tr}(\mathbf{AB}) = \mathrm {tr}(\mathbf{BA}) oraz \scriptstyle \mathrm{tr}\left(\mathbf A^\mathrm T\right) = \mathrm{tr}(\mathbf A).

Macierze postaci \scriptstyle \operatorname{diag}(a, a, \dots, a) nazywa się macierzami skalarnymi. Macierz skalarną \scriptstyle \mathbf I = \operatorname{diag}(1, 1, \dots, 1) nazywa się macierzą jednostkową. Jeżeli

\mathbf{AB} = \mathbf{BA} = \mathbf I,

gdzie wszystkie powyższe macierze są kwadratowe ustalonego stopnia, to macierz \scriptstyle \mathbf B jest wyznaczona jednoznacznie − nazywa się ją macierzą odwrotną do \scriptstyle \mathbf A oraz oznacza symbolem \scriptstyle \mathbf A^{-1}, o macierzy \scriptstyle \mathbf A powiada się zaś wtedy, że jest odwracalna.

Wyznacznik

Macierz nad strzałką reprezentuje przekształcenie liniowe \scriptstyle \mathrm f przestrzeni \scriptstyle \mathbb R^2 w siebie, które odwzorowuje wektory \scriptstyle \mathbf x_1, \mathbf x_2 rozpinające niebieski kwadrat na wektory \scriptstyle \mathrm f(\mathbf x_1), \mathrm f(\mathbf x_2) rozpinające zielony równoległobok; jej wyróżnik wynosi \scriptstyle -1, co oznacza, że pole powierzchni zielonego równoległoboku jest równe polu powierzchni niebieskiego kwadratu, lecz przekształcenie zamienia kolejność wektorów, czyli zmienia ich orientację na przeciwną: z lewoskrętnej na prawoskrętną – innymi słowy zmienia kąt zorientowany na przeciwny (zob. strzałka pomiędzy wektorami).

Wyznacznikiem \scriptstyle \mathrm{det}(\mathbf A) albo \scriptstyle |\mathbf A| macierzy kwadratowej \scriptstyle \mathbf A nazywa się liczbę kodującą pewne właściwości przekształcenia \scriptstyle \mathrm A, reprezentowanego przez tę macierz: jego wartość bezwzględna jest równa (w \scriptstyle \mathbb R^2) polu powierzchni obrazu kwadratu jednostkowego, tzn. pewnego równoległoboku, albo (w \scriptstyle \mathbb R^3) objętości obrazu sześcianu jednostkowego, tzn. pewnego równoległościanu[4], a znak mówi o orientacji przekształcenia − jest on dodatni wtedy oraz tylko wtedy, kiedy przekształcenie zachowuje orientację[5]; macierz o wyznaczniku jednostkowym reprezentuje przekształcenie równopolowe. Macierz o zerowym wyznaczniku nazywa się osobliwą albo zdegenerowaną (przekształcenie „spłaszcza” bądź „skleja”), w przeciwnym przypadku nazywa się ją nieosobliwą albo niezdegenerowaną. Macierz jest odwracalna wtedy oraz tylko wtedy, kiedy jest nieosobliwa, co ma z kolei miejsce wtedy oraz tylko wtedy, kiedy jej rząd jest maksymalny, czyli równy jej stopniowi.

Wyznacznik macierzy stopnia drugiego dany jest wzorem

\det \begin{bmatrix} a & b \\ c & d \end{bmatrix} = ad - bc.

Wyznacznik macierzy stopnia trzeciego da się obliczyć za pomocą reguły Sarrusa, z tym że wzór Leibniza (znany także jako permutacyjna definicja wyznacznika) uogólnia te wzory na macierze dowolnych stopni. Twierdzenie Cauchy'ego o wyznacznikach mówi, że wyróżnik iloczynu macierzy jest równy iloczynowi ich wyznaczników, \scriptstyle \det(\mathbf{AB}) = \det(\mathbf A) \det(\mathbf B). Dodanie wielokrotności dowolnego wiersza do innego (kolumny do innej) nie zmienia wartości wyznacznika; zamiana miejscami dwóch wierszy (kolumn) zmienia znak wyznacznika na przeciwny. Za pomocą tych operacji da się przekształcić dowolną macierz w macierz dolno- albo górnotrójkątną, a wyróżnik tego rodzaju macierzy jest równy iloczynowi elementów na przekątnej głównej (w szczególności jest to prawda dla macierzy diagonalnych). Rozwinięcie Laplace'a dopuszcza wyrażenie wyznacznika za pomocą minorów, tzn. wyznaczników podmacierzy głównych (twierdzenie to dopuszcza rekurencyjne zdefiniowanie wyznacznika począwszy od wyznacznika macierzy stopnia pierwszego jako jej jedynego elementu, czy nawet wyznacznika macierzy zerowego stopnia równego z definicji jedności[6]). Minory podmacierzy głównej (tzn. zawierające elementy głównej przekątnej) nazywa się minorami głównymi; kiedy minor podstawowy zawiera kolejne, począwszy od pierwszego, elementy głównej przekątnej, nazywa się go wiodącym minorem głównym. Wśród wszystkich niezerowych minorów tej macierzy istnieje choć jeden o największym stopniu; rząd macierzy wyznaczony jest przez stopień tego minoru (nie przekracza więc liczby jej wierszy, czy kolumn). Każdy niezerowy minor macierzy stopnia równego jej rzędowi nazywa się minorem bazowym tej macierzy. Wyznaczniki stosuje się także do rozwiązywania układów równań liniowych za pomocą wzorów Cramera, gdzie iloraz wyznaczników dwóch powiązanych macierzy kwadratowych jest równy wartości każdej ze zmiennych układu.

Zagadnienie własne

Niezerowy wektor \scriptstyle \mathbf v oraz liczbę \scriptstyle \lambda spełniające tożsamość \scriptstyle \mathrm A(\mathbf v) = \lambda \mathbf v nazywa się odpowiednio wektorem własnym oraz (stowarzyszoną z nim) wartością własną danego endomorfizmu \scriptstyle \mathrm A; w zapisie macierzowym powyższe równanie przyjmuje postać

\mathbf{AV} = \lambda \mathbf V,

gdzie (przy ustalonej bazie) \scriptstyle \mathbf A jest macierzą reprezentującą \scriptstyle \mathrm A, zaś \scriptstyle \mathbf V jest macierzą współczynników wektora \scriptstyle \mathbf v.

Dla przykładu dla endomorfizmów opisanych w sekcji Przekształcenia liniowe wektory \scriptstyle [1, 0];\ [0, 1] są wektorami własnymi symetrii, przekształcenia ekwiafinicznego oraz jednokładności z wartościami własnymi odpowiednio \scriptstyle (-1, 1);\ (3/2, 2/3);\ (3/2, 3/2); wyłącznym wektorem własnym powinowactwa jest \scriptstyle [1, 0] o podwójnej wartości własnej \scriptstyle 1; wektorami własnymi obrotu stowarzyszonymi z wartościami własnymi \scriptstyle \cos 30^\circ \pm i\sin 30^\circ\scriptstyle [1, i];\ [1, -i].

Powyższe równanie da się przekształcić do równoważnej postaci \scriptstyle \mathbf{AV} - \lambda \mathbf V = \boldsymbol \Theta, czyli zapisać w formie układu równań liniowych, \scriptstyle (\mathbf A - \lambda \mathbf I) \mathbf V = \boldsymbol \Theta, gdzie \scriptstyle \mathbf I jest macierzą jednostkową, co ze względu na niezerowość \scriptstyle \mathbf V oznacza wymaganie, by macierz \scriptstyle (\mathbf A - \lambda \mathbf I) tego układu była nieodwracalna lub, równoważnie, osobliwa, tzn.

\det (\mathbf A - \lambda \mathbf I) = 0.

Funkcja skalarna \scriptstyle \mathrm p_\mathbf A(t) = \det (\mathbf A - t \mathbf I) jest wielomianem stopnia \scriptstyle n nazywanym wielomianem charakterystycznym macierzy \scriptstyle \mathbf A; wielomian ten ma co najwyżej \scriptstyle n wielorakich pierwiastków, którymi są wartości własne macierzy[7]. Zgodnie z twierdzeniem Cayleya-Hamiltona dla macierzy \scriptstyle \mathbf A spełnione jest równanie macierzowe \scriptstyle p_\mathbf A(\mathbf A) = \boldsymbol \Theta; przykładowo jeśli \scriptstyle \mathbf A = \left[\begin{smallmatrix} 1 & 2 \\ 3 & 4 \end{smallmatrix}\right], to \scriptstyle \mathrm p_\mathbf A(t) = t^2 - 5t - 2, skąd \scriptstyle \mathrm p_\mathbf A(\mathbf A) = \mathbf A^2 - 5\mathbf A - 2\mathbf I, czyli np. \scriptstyle \mathbf A^2 = 5\mathbf A + 2\mathbf I (zob. Rozkłady macierzy oraz Aspekty numeryczne)

Każda z wartości własnych opisuje przekształcenie wzdłuż wektorów własnych − tak wyznacznik, będący iloczynem wartości własnych[8], jak oraz ślad, równy sumie wartości własnych, stanowią istotną informację o rodzaju przekształcenia liniowego: ślad bywa interpretowany jako nieskończenie mała przeistoczenie objętości (jako pochodna wyznacznika będącego wielomianem, zob. wzór Jacobiego), z tym że dodatni znak wyznacznika mówi o tym, czy przekształcenie jest złożeniem parzystej liczby symetrii[9] (zachowuje orientację), a jego moduł opisuje przyrost wzdłuż każdego z wektorów własnych przekształcenia (tzn. jego bezwzględną zmianę pola bądź objętości).

Symetria oraz określoność

Macierz \scriptstyle \mathbf A; określoność; stowarzyszona forma kwadratowa \scriptstyle Q_\mathbf A(x, y); wektory spełniające \scriptstyle Q_\mathbf A(x, y) = 1.
\begin{bmatrix} \tfrac{1}{4} & 0 \\ 0 & \tfrac{1}{4} \end{bmatrix} \begin{bmatrix} \tfrac{1}{4} & 0 \\ 0 & -\tfrac{1}{4} \end{bmatrix}
dodatnio określona nieokreślona
\tfrac{1}{4} x^2 + \tfrac{1}{4} y^2 \tfrac{1}{4} x^2 - \tfrac{1}{4} y^2
Ellipse in coordinate system with semi-axes labelled.svg
Elipsa
Hyperbola2.png
Hiperbola

Macierz kwadratową \scriptstyle \mathbf A równą swojemu przestawieniu, \scriptstyle \mathbf A = \mathbf A^\mathrm T, nazywa się symetryczną; jeśli jest ona równa przeciwności swojego przestawienia, \scriptstyle \mathbf A = -\mathbf A^\mathrm T, to nazywa się ją antysymetryczną. W przypadku macierzy zespolonych symetrię macierzy zastępuje się wielokrotnie jej hermitowskością (samosprzężonością), tzn. rozpatruje się \scriptstyle \mathbf A = \mathbf A^\star, gdzie gwiazdka oznacza sprzężenie hermitowskie macierzy, tzn. złożenie przestawienia macierzy ze sprzężeniem zespolonym jej elementów.

Każdej formie dwuliniowej \scriptstyle B\colon K^n \times K^n \to K da się przyporządkować macierz kwadratową \scriptstyle \mathbf B = [B_{ij}] stopnia \scriptstyle n, gdzie \scriptstyle B_{ij} = B(\mathbf e_i, \mathbf e_j), a \scriptstyle \{\mathbf e_i\} jest standardową bazą przestrzeni współrzędnych \scriptstyle K^n. Jeśli macierz \scriptstyle \mathbf B jest symetryczna (albo samosprzężona w przypadku zespolonym), to bywa ona postrzegana jako macierz formy kwadratowej \scriptstyle Q(\mathbf x) = B(\mathbf x, \mathbf x). Przyłożeniu formy dwuliniowej \scriptstyle B do pary wektorów \scriptstyle \mathbf x, \mathbf y odpowiada wówczas mnożenie \scriptstyle \mathbf X^\mathrm T \mathbf{BY}, skąd obliczeniu wartości formy kwadratowej \scriptstyle Q dla wektora \scriptstyle \mathbf x odpowiada wówczas mnożenie \scriptstyle \mathbf X^\mathrm T \mathbf{BX}, gdzie \scriptstyle \mathbf X, \mathbf Ymacierzami jednokolumnowymi zawierającymi współczynniki wektorów \scriptstyle \mathbf x, \mathbf y.

Formę kwadratową \scriptstyle Q nazywa się dodatnio albo ujemnie określoną albo nieokreśloną, jeżeli dla wszystkich niezerowych wektorów \scriptstyle \mathbf x forma \scriptstyle Q(\mathbf x) przyjmuje odpowiednio jedynie wartości dodatnie, ujemne, bądź obu znaków. Jeśli forma przyjmuje jedynie wartości nieujemne albo niedodatnie, to nazywa się ją odpowiednio określoną nieujemnie albo niedodatnio (półokreśloną dodatnio bądź ujemnie); w ten sposób forma jest nieokreślona wtedy oraz tylko wtedy, kiedy nie jest określona ani nieujemnie, ani niedodatnio; forma mająca (choć jedną) wartość własną równą zeru nazywa się osobliwą (zdegenerowaną) w przeciwnym przypadku nazywa się ją nieosobliwą (niezdegenerowaną). Określoność macierzy \scriptstyle \mathbf B definiuje się jako określoność reprezentowanej przez nią formy kwadratowej \scriptstyle Q (czyli odpowiadającej jej formy dwuliniowej \scriptstyle B); identycznie ma się rzecz ze zdegenerowaniem. Terminy dotyczące określoności form przenoszą się wprost na odpowiadające im macierze; osobliwość formy odpowiada wtedy osobliwości jej macierzy (co da się także sprawdzić za pomocą wyznacznika albo rzędu).

Twierdzenie spektralne mówi, że rzeczywiste macierze symetryczne oraz zespolone macierze hermitowskie są diagonalizowalne, tzn. istnieje taka baza, nazywana bazą własną, w której dowolny wektor da się przedstawić w postaci kombinacji liniowej wektorów własnych. Innymi słowy istnieje baza, w której dana forma kwadratowa ma macierz diagonalną, przy czym jej główna przekątna zawiera wartości własne stowarzyszone z wektorami bazy własnej − określoność formy kwadratowej (dwuliniowej), czy też jej macierzy, da się zatem definiować za pomocą (znaków) jej wartości własnych (tzw. kryterium Sylvestera określoności[10]). W szczególności diagonalizowalna jest macierz standardowego iloczynu skalarnego dowolnej przestrzeni współrzędnych, przy czym w bazie standardowej ma ona osoba macierzy jednostkowej, co oznacza, że iloczyn skalarny jest dodatnio określoną formą dwuliniową na tej przestrzeni; stąd jego działanie definiuje się zwykle w zapisie macierzowym wzorem \scriptstyle \mathbf X^\mathrm T \mathbf Y, z kolei stowarzyszona z nim forma kwadratowa definiuje kwadrat standardowej normy tej przestrzeni.

Aspekty numeryczne

nieoczekiwanie własności teoretycznych macierzy oraz ich związków z różnymi dziedzinami wiedzy z praktycznego punktu widzenia ważne jest efektywne oraz dokładne przeprowadzanie obliczeń na macierzach − dział matematyki obejmujący tę problematykę nazywa się numeryczną algebrą liniową. Zasadniczymi elementami są złożoność obliczeniowa oraz stabilność numeryczna algorytmu realizującego obliczenia. Zwykle stosuje się algorytmy wprost implementujące dane zagadnienie bądź różnorakie podejścia iteracyjne, np. wektor własny da się znaleźć wskazując ciąg wektorów zbiegający do tego wektora własnego.

Wyznaczenie złożoności algorytmu opiera się na wskazaniu górnego ograniczenia albo oszacowań liczby potrzebnych dodawań oraz mnożeń skalarów do wykonania danego algorytmu, np. mnożenia macierzy. Standardowe mnożenie dwóch macierzy typu \scriptstyle n \times n z definicji wymaga \scriptstyle n^3 mnożeń, albowiem dla każdego z \scriptstyle n^2 elementów macierzy potrzeba \scriptstyle n mnożeń. Klasyczny algorytm Strassena jest efektywniejszy niż opisany wyżej „naiwny” algorytm: potrzebuje zaledwie ok. \scriptstyle n^{2{,}807} mnożeń; aby przyspieszyć obliczenia uwzględnia się także cechy oraz własności urządzenia liczącego. W praktyce wielokrotnie dostępna jest dodatkowa wiedza o postaci macierzy − ważnym przypadkiem są macierze rzadkie, tzn. macierze, których przeważajaca ilość elementów jest zerami. Istnieją dla nich specjalnie przystosowane algorytmy, np. metoda gradientu sprzężonego rozwiązywania układów równań liniowych \scriptstyle \mathbf{AX} = \mathbf B dla macierzy rzadkiej \scriptstyle \mathbf A.

Intuicyjnie algorytm jest numerycznie stabilny, jeśli małe odchylenia argumentów (np. błędy zaokrągleń) nie prowadzą do dużych odchyleń wyników; przykładowo obliczanie macierzy odwrotnej z rozwinięcia Laplace'a, tzn. wzoru \scriptstyle \mathbf A^{-1} = \mathbf A^\mathrm D/\det \mathbf A (gdzie \scriptstyle \mathbf A^\mathrm D oznacza macierz dołączoną do \scriptstyle \mathbf A), może prowadzić do znaczących błędów zaokrągleń, kiedy wyróżnik macierzy jest bardzo mały (co do wartości bezwzględnej). Do oceny uwarunkowania problemów algebry liniowej, jak powyższe obliczanie odwrotności macierzy, stosuje się normy macierzy; przykładowo opracowano algorytmy rozkładu macierzy, które dopuszczają uniknięcie złego uwarunkowania, np. rozkład Schura.

Ujęcie algebraiczne oraz uogólnienia

Definicja

Niech \scriptstyle m, n będą dodatnimi liczbami całkowitymi, zaś \scriptstyle \langle c \rangle oznacza zbiór liczb \scriptstyle \{1, \dots, c\}[11], a \scriptstyle X będzie niepustym zbiorem. Macierzą nazywa się funkcję

\mathbf A\colon \langle m \rangle \times \langle n \rangle \to X,

gdzie \scriptstyle \langle m \rangle \times \langle n \rangle oznacza iloczyn kartezjański zbiorów \scriptstyle \langle m \rangle oraz \scriptstyle \langle n \rangle. Kilka uporządkowaną \scriptstyle (m, n), oznaczaną zwykle symbolem \scriptstyle m \times n, nazywa się typem macierzy \scriptstyle \mathbf A, jej argumenty (elementy dziedziny) − indeksami albo wskaźnikami, zaś zbiór wartości (elementy obrazu) − współczynnikami, elementami albo wyrazami; o macierzy \scriptstyle \mathbf A powiada się też wtedy, że jest określona nad zbiorem \scriptstyle X. Na podobieństwo ciągów, czy wektorów funkcję \scriptstyle \mathbf A(i, j) = a_{ij} oznacza się zwykle symbolicznie

\mathbf A = [a_{ij}],

gdzie element \scriptstyle a_{ij} oraz nazywa się wyrazem, współczynnikiem bądź elementem ogólnym macierzy; zwyczajowo pierwszą oraz drugą współrzędną wyrazu nazywa się odpowiednio jego wierszem oraz kolumną. Ustalenie pierwszej bądź drugiej współrzędnej funkcji \scriptstyle \mathbf A definiuje macierze odpowiednio typu \scriptstyle 1 \times n bądź \scriptstyle m \times 1 nazywane wierszem bądź kolumną macierzy \scriptstyle \mathbf A; dokładniej: \scriptstyle i-tym wierszem, odpowiednio \scriptstyle j-tą kolumną, macierzy \scriptstyle \mathbf A nazywa się macierze dane wzorami \scriptstyle \mathbf A_i\colon \{i\} \times \langle n \rangle \to X, bądź odpowiednio \scriptstyle \mathbf A^j\colon \langle m \rangle \times \{j\} \to X, przy czym nie ma ogólnie przyjętej notacji dotyczącej wierszy, czy kolumn danej macierzy[12] − macierze te nazywa się wielokrotnie wektorami wierszowymi bądź kolumnowymi, co wyjaśniono w oddzielnej sekcji.

Aby zaznaczyć typ macierzy wielokrotnie dodaje się go wyżej w pewnej formie za nawiasem, np. w indeksie dolnym: \scriptstyle [a_{ij}]_{m \times n} albo \scriptstyle [a_{ij}]_\underset{j = 1, \dots, n}{i = 1, \dots, m}. Zbiór wszystkich macierzy typu \scriptstyle m \times n nad zbiorem \scriptstyle X oznacza się symbolicznie \scriptstyle \mathrm M_{m \times n}(X), czy \scriptstyle \mathrm{Mat}_{m \times n}(X) opuszczając nieraz w typ macierzy albo zbiór jej współczynników, jeśli są znane z kontekstu albo \scriptstyle X^{m \times n}, X_m^n (zob. kolejna sekcja).

Klasy macierzy a wybór bazy

W zbiorze macierzy \scriptstyle \mathrm{Mat}_{m \times n} da się przeistoczenie wiele wielorakich relacji równoważności dzielących ten zbiór na rozłączne klasy:

  • równość, \scriptstyle \mathbf A = \mathbf B, definiowana wzorem \scriptstyle a_{ij} = b_{ij} dla wszystkich \scriptstyle i, j;
  • podobieństwo, \scriptstyle \mathbf A \sim \mathbf B, mające miejsce wtedy oraz tylko wtedy, kiedy istnieje macierz odwracalna \scriptstyle \mathbf P spełniająca \scriptstyle \mathbf P^{-1} \mathbf{AP} = \mathbf B;
  • przystawanie, kongruencja, sprzężenie, \scriptstyle \mathbf A \cong \mathbf B, dane warunkiem istnienia takiej macierzy odwracalnej \scriptstyle \mathbf P, dla której \scriptstyle \mathbf P^\mathrm T \mathbf{AP} = \mathbf B;
  • równoważność, \scriptstyle \mathbf A \simeq \mathbf B zachodząca wtedy oraz tylko wtedy, kiedy są macierze odwracalne \scriptstyle \mathbf P, \mathbf Q, że \scriptstyle \mathbf P^{-1} \mathbf{AQ} = \mathbf B;
  • równoważność względem operacji elementarnych na wierszach (odp. kolumnach) albo krótko: równoważność elementarna (zwykle dla operacji na wierszach), określona wymaganiem istnienia skończonej liczby operacji elementarnych na wierszach (odp. kolumnach), które przekształcałyby daną macierz w drugą

Na relację podobieństwo, czy przystawania da się nakładać dodatkowe warunki, np. wymagać, by macierze \scriptstyle \mathbf P oraz \scriptstyle \mathbf Q były ortogonalne (podobieństwo/przystawanie ortogonalne, równoważność ortogonalna), czy unitarne (podobieństwo/przystawanie unitarne, równoważność unitarna). Podobieństwo macierzy pociąga ich równoważność. Dwie macierze są równoważne wtedy oraz tylko wtedy, kiedy ich rzędy są równe. Macierze równoważne elementarnie zachowują zbiór rozwiązań układów równań liniowych (równoważność względem operacji na kolumnach zachowuje dualny do danego układ równań liniowych); dla macierzy nad dobrymi strukturami (np. ciałem, a nawet pierścieniem ideałów głównych) elementarna równoważność pokrywa się z równoważnością.

\begin{matrix} V & \xrightarrow{\quad\ \mathrm T\ \quad} & W\\ \Bigg\updownarrow & & \Bigg\updownarrow \\ K^n & \xrightarrow[\mathrm T_A^B]{\quad\quad\quad} & K^m \end{matrix}
Diagram przemienny przedstawienia przekształcenia liniowego: górna strzałka symbolizuje przekształcenie liniowe niezależnie od wyboru bazy, pionowe strzałki oznaczają izomorfizmy pomiędzy przestrzeniami liniowymi a przestrzeniami współrzędnych, dolna strzałka oznacza przekształcenie liniowe przedstawione w bazach wyznaczonych przez wspomniane izomorfizmy[13][14].

W ogólności macierz może reprezentować przekształcenie liniowe pomiędzy dowolnymi przestrzeniami liniowymi skończonego wymiaru z ustalonymi bazami, czyli poprzez wybranie w nich „układów współrzędnych”, tzn. wskazanie izomorfizmów dziedziny oraz przeciwdziedziny z odpowiednimi przestrzeniami współrzędnych. Otóż przekształcenie liniowe \scriptstyle \mathrm T przestrzeni liniowej \scriptstyle V wymiaru \scriptstyle n w przestrzeń liniową \scriptstyle W wymiaru \scriptstyle n z bazami odpowiednio \scriptstyle A = (\mathbf a_j)_j oraz \scriptstyle B = (\mathbf b_i)_i bywa opisane dla każdego \scriptstyle j = 1, \dots, n wzorem

\mathrm T(\mathbf a_j) = \sum_{i=1}^m t_{ij} \mathbf b_i,

a więc poprzez zapisanie w macierzy \scriptstyle \mathbf T_A^B = [t_{ij}] kolumnowo obrazów wektorów bazy \scriptstyle A w bazie \scriptstyle B.

Przynależność macierzy do ustalonej klasy oznacza, iż przedstawienia we współrzędnych (wyrażone za pomocą macierzy) danego rodzaju przekształceń są niezależne od wyboru bazy: macierze danego przekształcenia liniowego w wielorakich bazach bywają różne, jednak stale są równoważne; analogicznie ma się rzecz z endomorfizmami liniowymi przestrzeni liniowej z ustaloną bazą − macierze kwadratowe danego endomorfizmu są do siebie podobne; wreszcie wybór bazy dla przestrzeni liniowej w przypadku form dwuliniowych (często symetrycznych bądź hermitowskich form kwadratowych) dopuszcza zapisanie ich w postaci macierzy kwadratowych (symetrycznych bądź hermitowskich), przy czym macierze tej samej formy są przystające (podobnie ma się rzecz z formami oraz macierzami antysymetrycznymi). Wyznacznik oraz wartości własne macierzy równoważnych są równe, zatem są one niezmiennikami przekształceń liniowych; twierdzenie Sylvestera o bezwładności form kwadratowych mówi, iż liczba oraz znaki wartości własnych macierzy przystających o rzeczywistych współczynnikach są równe, co oznacza, że są one niezmiennikami rzeczywistych form kwadratowych (symetrycznych form dwuliniowych). We wszystkich przypadkach macierze \scriptstyle \mathbf P, \mathbf Q pełnią rolę macierzy zmiany bazy (tzw. „macierze przejścia” z jednej bazy do innej).

Rozkłady macierzy

Wspomniana w sekcji Symetria oraz określoność diagonalizacja będąca przedstawieniem macierzy w postaci macierzy diagonalnej (podobnej do danej, zob. poprzednią sekcję) jest w istocie jedną z wielu innych metod rozkładów macierzy, czyli przekształcania macierzy do przystępniejszych postaci (nazywanych zbiorczo postaciami normalnymi bądź kanonicznymi); zasadniczą cechą tych rozkładów jest zachowywanie pewnych własności danych macierzy, np. wyznacznika, rzędu, czy odwrotności, które łatwo odczytać z uzyskanej postaci bądź możliwość algorytmicznego uproszczenia konkretnych operacji na macierzach określonego rodzaju.

Rozkład LU macierzy opiera się na przedstawieniu jej w postaci iloczynu macierzy trójkątnych: dolnej (\scriptstyle \mathbf L, od ang. lower) oraz górnej (\scriptstyle \mathbf U, od ang. upper). Wyznaczenie tego rozkładu znacząco upraszcza rozwiązywanie układów równań liniowych za pomocą tzw. podstawień w przód oraz wstecz; analogicznie łatwo uzyskać z tej postaci odwrotność macierzy trójkątnych. Pokrewnym poprzedniemu algorytmem jest eliminacja Gaussa: przekształca daną macierz do postaci schodkowej. Obie metody da się opisać za pomocą składania danej macierzy przez odpowiednie macierze elementarne odpowiadające permutacjom wierszy oraz dodawaniu wielokrotności danego wiersza do innego. Rozkład wedle wartości osobliwych wyraża dowolną macierz jako iloczyn \scriptstyle \mathbf{UDV}^\star trzech macierzy: unitarnych \scriptstyle \mathbf U, \mathbf V oraz diagonalnej \scriptstyle \mathbf D, gdzie \scriptstyle \mathbf V^\star oznacza macierz sprzężoną hermitowsko (w przypadku zespolonym; przestawioną w przypadku rzeczywistym) do \scriptstyle \mathbf V.

Macierz w postaci Jordana; klatki oznaczone szarym kolorem to tzw. klatki Jordana (puste miejsce oznacza zero).

Rozkład wedle wartości własnych bądź diagonalizacja to rozkład danej macierzy \scriptstyle \mathbf A na iloczyn \scriptstyle \mathbf{VDV}^{-1} macierzy diagonalnej \scriptstyle \mathbf D oraz odwracalnej \scriptstyle \mathbf V (macierz, którą da się przedstawić w tej postaci nazywa się diagonalizowalną). Ogólną metodą rozkładu, która jest możliwa do przeprowadzenia dla dowolnej macierzy, jest rozkład Jordana przekształcający daną macierz do postaci (normalnej) Jordana, tzn. macierzy, której jedynymi niezerowymi elementami są znajdujące się na głównej przekątnej wartości własne \scriptstyle \lambda_1, \dots, \lambda_n macierzy \scriptstyle \mathbf A oraz być może elementy jednostkowe znajdujące się na nadprzekątnej głównej (zob. rysunek obok). W rozkładzie wedle wartości własnych \scriptstyle n-tą potęgę macierzy \scriptstyle \mathbf A (tzn. \scriptstyle n-krotne mnożenie macierzy przez siebie) da się obliczyć wg wzoru

\mathbf A^n = \left(\mathbf{VDV}^{-1}\right)^n = \mathbf{VDV}^{-1} \dots \mathbf{VDV}^{-1} = \mathbf V \mathbf D^n \mathbf V^{-1},

a potęgę macierzy diagonalnej oblicza się podnosząc do potęgi elementy z jej przekątnej głównej − jest to wydatnie prostsza operacja niż potęgowanie macierzy \scriptstyle \mathbf A w postaci wyjściowej. Potęgowanie macierzy jest dopuszcza zdefiniowanie eksponenty macierzy \scriptstyle \exp \mathbf A, która analogicznie do eksponenty rzeczywistej czy zespolonej znajduje wiele zastosowań: rozwiązywanie liniowych równań różniczkowych, obliczanie logarytmów macierzy, czy ich pierwiastków kwadratowych.

Współczynniki, algebra oraz grupy macierzy

Choć w definicji zbiór współczynników nie ma żadnej wyróżnionej struktury, to moc zastosowań metod macierzowych wynika z dodatkowej struktury algebraicznej określonej w tym zbiorze, która dopuszcza zdefiniowanie podstawowych działań na macierzach, co skutkuje wprowadzeniem konkretnej struktury algebraicznej w zbiorze macierzy ustalonego typu, czy rodzaju. W artykule skupiono się na ciałach (którymi są np. zbiór liczb rzeczywistych, czy zespolonych), choć uprawianie algebry liniowej za pomocą teorii macierzy możliwe jest już w przypadku zastosowania pierścieni (np. zbioru liczb całkowitych).

Zbiór macierzy \scriptstyle \mathrm{Mat}_{m \times n} tworzy grupę ze względu na dodawanie macierzy z macierzą zerową \scriptstyle \boldsymbol \Theta złożoną z samych zer pełniącą rolę elementu neutralnego; jeśli dodawanie w zbiorze współczynników jest przemienne (z definicji w ciele albo pierścieniu przemiennym), to jest ona abelowa. Dołączenie mnożenia przez skalary czyni z grupy \scriptstyle \mathrm{Mat}_{m \times n} przestrzeń liniową (wymiaru \scriptstyle mn) w przypadku, kiedy zbiór skalarów ma strukturę ciała albo moduł (wolny rangi \scriptstyle mn), jeśli skalary składają się na pierścień[15]. Mnożenie macierzy nad pierścieniem nieprzemiennym wyznacza się analogicznie jak w przypadku ciał, jednak działanie to nie ma wówczas tak dobrych własności.

Zbiór macierzy kwadratowych stopnia \scriptstyle n tworzy nieprzemienny pierścień z jedynką ze względu na mnożenie nazywany pierścieniem macierzy; uwzględniając strukturę przestrzeni liniowej (modułu) macierze kwadratowe danego stopnia są nieprzemienną algebrą nad ciałem z jedynką (nieprzemienną algebrą nad pierścieniem). Macierze przeciwna oraz odwracalna są elementami odwrotnym oraz odwracalnym w algebrze macierzy kwadratowych; zbiór macierzy odwracalnych ustalonego stopnia tworzy ze względu na mnożenie macierzy ogólną albo pełną grupę liniową \scriptstyle \mathrm{GL}_n generowaną przez macierze elementarne. Grupami macierzowymi nazywa się właśnie podgrupy ogólnej grupy liniowej (z działaniem mnożenia); jest nią np. szczególna albo specjalna grupa liniowa \scriptstyle \mathrm{SL}_n składająca się z macierzy odwracalnych o wyznaczniku jednostkowym (podgrupa normalna generowana przez operację elementarną dodawania wiersza pomnożonego przez odwracalną liczbę do innego w przypadku ciał). Każda grupa skończona jest izomorficzna z grupą macierzową, da się się o tym przekonać rozpatrując reprezentację regularną grupy symetrycznej. Ogólne grupy da się badać za pomocą dobrze znanych grup macierzy, które zostały nader dobrze poznane dzięki teorii reprezentacji.

Jeżeli pierścień współczynników macierzy kwadratowej jest przemienny, to możliwe jest zdefiniowanie jej wyznacznika[16]. Niezerowość wyznacznika dla macierzy określonych nad ciałami trzeba zamienić w przypadku pierścieni na warunek jego odwracalności. Ze wzorów Cramera (własności macierzy dołączonej) wynika, że macierz kwadratowa nad pierścieniem przemiennym jest odwracalna wtedy oraz tylko wtedy, kiedy jest nieosobliwa.

Nad (przemienną) dziedziną ideałów głównych podmoduł modułu wolnego jest wolny, a jego ranga nie przekracza rangi całego modułu. Z uwagi na z tym owocne jest dla macierzy \scriptstyle \mathbf A typu \scriptstyle m \times n nad dziedziną ideałów głównych \scriptstyle R rozważanie podmodułów modułów \scriptstyle \mathrm{Mat}_{m \times 1}(R) oraz \scriptstyle \mathrm{Mat}_{1 \times n}(R) generowanych odpowiednio przez kolumny oraz wiersze macierzy \scriptstyle \mathbf A. Podmoduły te posiadają równe rangi, a ich wspólną wartość nazywa się rzędem macierzy \scriptstyle \mathbf A. Rząd \scriptstyle \mathbf A jest równy największemu stopniowi jej niezerowego minoru oraz jest równy rzędowi tej samej macierzy nad ciałem ułamków pierścienia \scriptstyle R; rząd macierzy nie przekracza liczby jej wierszy oraz kolumn.

Jeśli współczynniki należą do ciała liczb rzeczywistych albo zespolonych, to ogólna grupa liniowa ma strukturę grupy Liego (wymiaru równemu stopniowi macierzy w przypadku rzeczywistym oraz dwukrotnie większemu w przypadku zespolonym), tzn. mnożenie oraz odwracanie macierzy są ciągłe (w topologii euklidesowej macierzy traktowanych jako „długie” wektory[17]). Ponadto jest otwartą rozmaitością afiniczną w przestrzeni wszystkich macierzy ustalonego stopnia (jej niepustym podzbiorem otwartym w topologii Zariskiego), a nawet rozmaitością różniczkową (tego samego wymiaru). Algebra Liego \scriptstyle \mathfrak{gl}_n odpowiadająca tej grupie, tzn. struktura oddająca intuicję nieskończenie małych przekształceń tych grup (por. pochodna Liego), składa się ze wszystkich macierzy kwadratowych tego samego stopnia z komutatorem pełniącym rolę nawiasu Liego; algebra Liego \scriptstyle \mathfrak{sl}_n specjalnej grupy liniowej (będącą podrozmaitością ogólnej grupy liniowej) zawiera wszystkie macierze kwadratowe ustalonego stopnia o zerowym śladzie.

Macierze nieskończone oraz puste

Rozpatruje się także macierze o nieskończonej liczbie wierszy i/lub kolumn − formalnie wystarczy, iż dla dowolnych elementów indeksujących wiersze oraz kolumny istnieje dobrze określony element macierzy (zbiory indeksów nie muszą być nawet podzbiorami liczb naturalnych). Analogicznie jak w przypadku skończonym da się zdefiniować dodawanie, odejmowanie, mnożenie przez skalar, czy przestawienie macierzy, choć mnożenie macierzy wymagać może określenia nieskończonego sumowania do zdefiniowania elementów iloczynu. Jeśli macierz nieskończona ma opisywać przekształcenie liniowe, to jej wszystkie kolumny muszą posiadać skończoną liczbę niezerowych elementów. Wynika to stąd, iż dla macierzy \scriptstyle \mathbf A reprezentującej przekształcenie liniowe \scriptstyle \mathrm A\colon V \to W, z ustalonymi bazami dla przestrzeni liniowych, każdy wektor przestrzeni bywa zapisany jednoznacznie jako (skończona) kombinacja liniowa wektorów bazowych, a więc jako macierz jednokolumnową („wektor kolumnowy”) \scriptstyle \mathbf X, w której tylko skończenie wiele elementów jest wielorakich od zera. Wówczas kolumny \scriptstyle \mathbf A zawierają kolejne obrazy w przekształceniu \scriptstyle \mathrm A macierzy jednokolumnowych odpowiadających obrazom wektorów bazowych przestrzeni \scriptstyle V w bazie przestrzeni \scriptstyle W, co ma sens jedynie wtedy, kiedy kolumny te posiadają skończenie wiele niezerowych elementów. Nie ma jednakże ograniczenia na liczbę wierszy macierzy \scriptstyle \mathbf A, otóż w iloczynie \scriptstyle \mathbf{AX} ukazuje się tylko skończenie wiele niezerowych współczynników macierzy jednokolumnowej \scriptstyle \mathbf X, przez co każdy z elementów tego iloczynu, nawet jeśli jest dany jako nieskończona suma iloczynów, zawiera tylko skończenie wiele wielorakich od zera elementów, skąd wynika, iż jest on dobrze określony. Co więcej, oznacza to założenie kombinacji liniowej kolumn macierzy \scriptstyle \mathbf A, która efektywnie zawiera jedynie skończenie wiele z nich, stąd albowiem każda kolumna zawiera tylko skończenie wiele niezerowych elementów, to oraz wynik ma ich tyle. Iloczyn dwóch macierzy danego typu jest także dobrze określony (z zastrzeżeniem równości zbiorów indeksujących odpowiednio wiersze oraz kolumny tych macierzy), jest tego samego typu oraz odpowiada złożeniu przekształceń liniowych.

Macierze nieskończone wykorzystuje się do opisu operatorów na przestrzeni Hilberta, gdzie narzuca się dodatkowe ograniczenia ze względu na zbieżność odpowiednich sum oraz ciągłość przekształceń. Z ogólnego punktu widzenia macierze jednak zaciemniają ogląd − z tego powodu częściej wykorzystuje się z abstrakcyjnych, potężniejszych metod analizy funkcjonalnej.

Macierz pusta to macierz, której liczba wierszy albo kolumn jest równa zeru. Ułatwiają one rozważania teoretyczne dotyczące zerowej przestrzeni liniowej, np. jeśli macierz \scriptstyle \mathbf A jest typu \scriptstyle 3 \times 0, a macierz \scriptstyle \mathbf B jest typu \scriptstyle 0 \times 3, to ich iloczyn \scriptstyle \mathbf{AB} jest macierzą zerową typu \scriptstyle 3 \times 3 odpowiadającą przekształceniu zerowemu pewnej trójwymiarowej przestrzeni liniowej w siebie, z tym że iloczyn \scriptstyle \mathbf{BA} jest macierzą typu \scriptstyle 0 \times 0. Nie ma ustalonej notacji dotyczącej macierzy pustych, choć przeważajaca ilość systemów algebry komputerowej dopuszcza ich wykonywanie oraz prowadzenie obliczeń z ich udziałem. Wyznacznik macierzy typu \scriptstyle 0 \times 0 wynosi jeden, co wynika z obecności iloczynu pustego występującego we wzorze Leibniza na wyznacznik. Wartość ta jest zgodna z faktem służącym wielokrotnie charakteryzacji wyznacznika, iż przekształcenie tożsamościowe z dowolnej skończeniewymiarowej przestrzeni liniowej w siebie ma wyróżnik 1. Istnienie macierzy stopnia zerowego jest niezbędne w rozważaniach teoriokategoryjnych – macierze nad ustalonym ciałem składają się na kategorię addytywną, która musi zawierać obiekt zerowy, tu: macierze puste.

Tensory

Information icon.svg Osobny artykuł: tensor.

Macierze wielowskaźnikowe to macierze z dowolną liczbą wskaźników indeksujących elementy takiej macierzy - macierze zerowskaźnikowe to opisane wyżej macierze puste, jednowskaźnikowe bywają utożsamiane z wektorami albo ciągami, dwuwskaźnikowe to macierze opisane w tym artykule (również nieskończone), macierze trójwskaźnikowe da się wyobrażać sobie jako uszeregowane w kratkach prostopadłościanu (być może nieskończonego). Formalnie macierz \scriptstyle r-wskaźnikowa o elementach ze zbioru \scriptstyle X to funkcja \boldsymbol A\colon \langle n_1 \rangle \times \cdots \times \langle n_r \rangle \to X.

Wiki letter w.svg Ta sekcja jest niekompletna. Jeśli możesz, rozbuduj ją.

Zastosowania

Macierze znalazły mnóstwo zastosowań, tak w matematyce, jak oraz w naukach przyrodniczych – pewne z nich wykorzystują zaledwie zwarty sposób zapisu zbioru liczb w postaci tablicy. Dla przykładu w teorii gier oraz ekonomii macierz wypłat koduje wypłatę gracza w zależności od jego wyboru spośród (skończonego) zbioru możliwości. W eksploracji tekstu oraz automatycznym kompilowaniu tezaurusów wykorzystuje się z macierzy częstości dokument-słowo (albo macierzy częstotliwości słowo-dokument; ang. document-term [frequency] matrix, DTM albo term-document [frequency] matrix, TDM), np. tf-idf, do śledzenia częstości pewnych słów w kilku dokumentach.

Liczby zespolone da się przedstawić za pomocą szczególnych macierzy rzeczywistych typu \scriptstyle 2 \times 2 za pomocą odwzorowania

a + bi \leftrightarrow \begin{bmatrix} a & -b \\ b & a \end{bmatrix},

w którym dodawanie oraz mnożenie liczb zespolonych oraz macierzy odpowiadają sobie wzajemnie. Dla przykładu macierze obrotu stopnia \scriptstyle 2 odpowiadają mnożeniu przez liczbę zespoloną o module \scriptstyle 1 (por. Przekształcenia liniowe). Podobnej interpretacji da się dokonać dla kwaternionów.

Wczesne techniki szyfrowania (np. szyfr Hilla) da się opisać za pomocą macierzy, jednakże oznacza to, że kody te są względnie proste do złamania (z powodu ich liniowej natury). W grafice komputerowej macierze wykorzystuje się do reprezentowania obiektów oraz ich przekształceń afinicznych − przykładem bywa rzut trójwymiarowego obiektu na dwuwymiarowy ekran uwzględniający teoretyczną pozycję obserwatora (kamery). Macierze nad pierścieniami wielomianów są istotnym elementem opisu w teorii sterowania.

W chemii macierze wykorzystuje się na wiele sposobów – w szczególności, ze względu na wykorzystanie teorii kwantów, do opisu wiązań pomiędzy cząsteczkami oraz spektroskopii. Przykładami są macierz nakładania (ang. overlap matrix) oraz macierz Foka wykorzystywane do rozwiązywania równań Roothaana w celu uzyskania orbitali cząsteczkowych za pomocą metody Hartree'ego-Foka.

Teoria grafów

Information icon.svg  Sprawdź też: teoria grafów.
Nieskierowany graf o macierzy sąsiedztwa \scriptstyle \left[\begin{smallmatrix}
2 & 1 & 0 \\ 1 & 0 & 1 \\ 0 & 1 & 0 \end{smallmatrix}\right].

Jednym z fundamentalnych obiektów teorii grafów jest macierz sąsiedztwa skończonego grafu – zapisana jest w niej informacja o tym, które wierzchołki grafu są połączone krawędzią. Innym sposobem opisu takiego grafu jest macierz incydencji parująca wierzchołki oraz krawędzie. Macierze zawierające tylko dwie zróżnicowane wartości (0 oraz 1 oznaczające przykładowo „tak” oraz „nie”) nazywa się macierzami logicznymi. Z kolei macierz odległości (lub kosztów) zawiera informację o wzajemnych odległościach krawędzi. Pojęcia te stosuje się do opisu rozmieszczenia (topologii) witryn internetowych połączonych odnośnikami, czy miastami połączonymi za pomocą dróg; jeśli sieć dróg nie jest zbyt gęsta, to macierze są zwykle rzadkie, tzn. zawierają mało niezerowych elementów. Dla tego rodzaju macierzy są odpowiednio przystosowane algorytmy stosowane w teorii sieci.

Analiza oraz geometria

Macierz Hessego funkcji różniczkowalnej o wartościach skalarnych (tzw. pola skalarnego) \scriptstyle f\colon \mathbb R^n \to \mathbb R składa się z drugich pochodnych funkcji \scriptstyle f względem osi współrzędnych, tzn.

\mathbf H_f = \left[\frac {\partial^2 f}{\partial x_i \, \partial x_j} \right]_{ij}.
W punkcie siodłowym \scriptstyle (x, y) = \color{red} (0, 0) funkcji \scriptstyle f(x, y) = x^2 - y^2 macierz Hessego \scriptstyle \left[\begin{smallmatrix} 2 & 0 \\ 0 & -2 \end{smallmatrix}\right] jest nieokreślona.

Koduje ona informację o lokalnym wzroście funkcji: dla danego punktu krytycznego \scriptstyle \mathrm x = (x_1, \dots, x_n), czyli punktu, w którym znikają pierwsze pochodne cząstkowe \scriptstyle \partial f/\partial x_i funkcji \scriptstyle f, przyjmuje ona minimum lokalne, o ile macierz Hessego jest dodatnio określona (i maksimum lokalne, kiedy jest ona ujemnie określona). W kwestii znalezienia minimów oraz maksimów funkcji kwadratowych blisko związanych z formami kwadratowymi stowarzyszonymi z macierzami (zob. Określoność) stosuje się programowanie kwadratowe.

Inną macierzą wielokrotnie stosowaną w ujęciu geometrycznym problemów analitycznych jest macierz Jacobiego przekształcenia różniczkowalnego \scriptstyle \mathrm f\colon \mathbb R^n \to \mathbb R^m. Jeśli \scriptstyle f_1, \dots, f_m oznaczają składowe \scriptstyle \mathrm f, to macierz Jacobiego da się zdefiniować jako

\mathbf J_\mathrm f = \left[\frac{\partial f_i}{\partial x_j}\right ]_{ij}.

Jeśli \scriptstyle n > m oraz rząd macierzy Jacobiego przyjmuje swoją maksymalną wartość \scriptstyle m, to z twierdzenia o przekształceniu odwrotnym[18] \scriptstyle \mathrm f jest lokalnie odwracalna w tym punkcie.

Równania różniczkowe cząstkowe da się sklasyfikować za pomocą macierzy współczynników operatorów różniczkowych najwyższego rzędu danego równania. Dla eliptycznych równań różniczkowych cząstkowych macierz ta jest dodatnio określona, co ma decydujący wpływ na zbiór możliwych rozwiązań badanego równania.

Ważną metodą rozwiązywania równań różniczkowych cząstkowych opisujących złożone układy fizyczne jest metoda elementów skończonych, w której rozwiązanie jest przybliżane za pomocą funkcji kawałkami liniowych, gdzie kawałki dostatecznie drobne; metodę da się następnie przedstawić w postaci równania macierzowego (zob. też metoda sztywności).

Rachunek prawdopodobieństwa oraz statystyka

Dwa zróżnicowane łańcuchy Markowa; wykres przedstawia liczbę cząsteczek (ok. 1000) w stanie „2”. Obie wartości graniczne da się wyznaczyć z macierzy przejścia, którymi są \scriptstyle \color{red} \left[\begin{smallmatrix} 0{,}7 & 0 \\ 0{,}3 & 1 \end{smallmatrix}\right] oraz \scriptstyle \left[\begin{smallmatrix} 0{,}7 & 0{,}2 \\ 0{,}3 & 0{,}8 \end{smallmatrix}\right].

Macierze stochastyczne to macierze, których wiersze odpowiadają wektorom prawdopodobieństwa, tzn. elementy wierszy sumują się do jedności. Macierze stochastyczne definiują łańcuchy Markowa o skończonej liczbie stanów. Wiersz macierzy stochastycznej opisuje rozkład prawdopodobieństwa następnego położenia danej cząstki w stanie odpowiadającym temu wierszowi. Własności łańcucha Markowa takie jak stany pochłaniające, tzn. stany, które dana cząstka dawniej osiągnie, da się odczytać z wartości własnych macierzy przejścia. Z uwagi na pokrewieństwo łańcuchów Markowa o skończonej liczbie stanów z grafami o skończonej liczbie wierzchołków do opisu pierwszych stosuje się metody opracowane dla drugich (zob. Teoria grafów).

W statystyce także wykorzystuje się z wielu rodzajów macierzy − statystyka opisowa zajmuje się przykładowo opisem zbiorów danych, które da się wielokrotnie przedstawić w postaci macierzowej przez uprzednie zmniejszenie liczby danych. Macierz kowariancji koduje wzajemną wariancję kilku zmiennych losowych. Kolejnym przykładem jest metoda najmniejszych kwadratów, w której przybliża się skończoną liczbę punktów \scriptstyle (x_1, y_1), \dots, (x_k, y_k) funkcją liniową

y_i = ax_i + b, \quad oraz = 1, \dots, k;

metodę tę da się opisać w języku macierzy opierając się na rozkładzie wg wartości osobliwych macierzy.

Macierze losowe to macierze zawierające liczby losowe podlegające odpowiedniemu rozkładowi prawdopodobieństwa, np. macierzowemu rozkładowi normalnemu. Ich zastosowanie wykracza poza rachunek prawdopodobieństwa − stosuje się je od teorii liczb po fizykę.

Symetrie oraz przekształcenia w fizyce

Information icon.svg  Sprawdź też: symetria w fizyce.

Przekształcenia liniowe oraz związane z nimi symetrie odgrywają we współczesnej fizyce kluczową rolę. Dla przykładu w kwantowej teorii pola cząstki elementarne klasyfikuje się jako reprezentacje grupy Lorentza szczególnej teorii względności, dokładniej: względem ich zachowania w działaniu grupy spinowej. Konkretne reprezentacje, w tym macierze Pauliego, czy ogólniejsze macierze gamma, są integralną częścią opisu fermionów zachowujących się jak spinory. Dla trzech najlżejszych kwarków istnieje grupowa reprezentacja wykorzystująca specjalną grupę unitarną \scriptstyle \mathrm{SU}(3); do obliczeń wykorzystuje się dogodne reprezentacje macierzowe znane jako macierze Gell-Manna, które stosuje się także do opisu grupy cechowania \scriptstyle \mathrm{SU}(3) tworzącej podstawę współczesnego opisu silnych oddziaływań jądrowych, chromodynamiki kwantowej. Z kolei macierz Cabibbo-Kobayashiego-Maskawy wyraża fakt, iż podstawowe stany kwarków, istotne dla oddziaływań słabych, nie są podstawowymi stanami kwarków definiującymi cząstkami z określonymi oraz różnymi masami, lecz są od nich liniowo zależne.

Kombinacje liniowe stanów kwantowych

Information icon.svg  Sprawdź też: mechanika kwantowa.

Pierwszy model mechaniki kwantowej (Heisenberg, 1925) przedstawiał operatory tej teorii za pomocą nieskończeniewymiarowych macierzy działających na stanach kwantowych; stąd pierwotna nazwa tej teorii to mechanika macierzowa. Szczególnym przykładem jest macierz gęstości charakteryzująca stan „mieszany” układu kwantowego jako kombinację liniową prostych, „czystych” stanów własnych.

Inna macierz służy jako kluczowe narzędzie opisu eksperymentów rozpraszania tworzących zrąb eksperymentalnej fizyki cząstek elementarnych: reakcje zderzenia, takie jakie zdarzają się w akceleratorach cząstek, gdzie nieoddziałujące na siebie cząstki pędzą ku sobie oraz zderzają się na małym obszarze oddziaływania produkując nowy zestaw nieoddziałujących ze sobą cząstek, bywają opisane za pomocą iloczynu skalarnego stanów cząsteczek wyjściowych oraz kombinacji liniowej stanów cząsteczek wejściowych. Kombinacja liniowa jest dana w postaci macierzy rozpraszania znanej także jako macierz S, która koduje wszystkie informacje o możliwych oddziaływaniach pomiędzy cząstkami.

Drgania swobodne

Information icon.svg  Sprawdź też: drgania swobodne.

W fizyce macierze stosuje się także do opisu liniowo sprzężonych układów harmonicznych. Równania ruchu takich układów da się opisać za pomocą macierzy, gdzie macierz masy przemnożona przez uogólnioną prędkość daje wyraz kinetyczny, a macierz siły przemnożona przez macierz przesunięcia (odpowiadającą wektorowi przesunięcia) charakteryzuje interakcje. Najlepszą metodą uzyskiwania rozwiązań jest wyznaczenie wektorów własnych układu, jego drgań swobodnych, poprzez diagonalizację równania macierzowego. Techniki tego rodzaju są istotne, kiedy w grę wchodzi wewnętrzna dynamika cząsteczek: drgania wewnętrzne układu składającego się ze wzajemnie związanych atomów. Wykorzystuje się je także do opisu drgań mechanicznych oraz oscylacji w obwodach elektrycznych.

Optyka geometryczna

Information icon.svg  Sprawdź też: optyka geometryczna.

W optyce geometrycznej, która z natury jest teorią aproksymatywną, zaniedbuje się falową naturę światła − w modelu tym promienie świetlne rozchodzą się po prostych. Jeśli ugięcie światła przez dany przyrząd optyczny nie jest duże, działanie soczewki czy zwierciadła da się wyrazić za pomocą mnożenia macierzy odpowiadającej wektorowi o dwu składowych przez macierz układu optycznego typu \scriptstyle 2 \times 2 nazywaną macierzą ABCD: elementami macierzy odpowiadającej wektorowi są nachylenie promienia oraz jego odległość od osi optycznej, macierz kwadratowa koduje z kolei własności urządzenia optycznego. W istocie wyróżnia się dwa rodzaje macierzy, tj. macierz załamania (lub refrakcji) opisująca załamanie na powierzchni soczewki oraz macierz przesunięcia (lub translacji), która opisuje przesunięcie płaszczyzny odniesienia do kolejnej płaszczyzny załamania, której opisem jest kolejna macierz załamania. Dzięki temu układ optyczny złożony z kombinacji soczewek i/lub zwierciadeł da się opisać za pomocą macierzy będącej iloczynem macierzy elementów tego układu.

Elektronika

Tradycyjna analiza obwodów elektrycznych prowadzi do układów równań liniowych, które bywają opisane za pomocą macierzy (np. metoda prądów oczkowych, czy metoda napięć/potencjałów węzłowych).

Zachowanie wielu elementów elektronicznych bywa opisane za pomocą macierzy: niech \scriptstyle \mathbf A oznacza macierz typu \scriptstyle 2 \times 1, którego pierwszym elementem jest napięcie \scriptstyle v_1, a drugą natężenie \scriptstyle i_1 wejściowe tego elementu, zaś \scriptstyle \mathbf B będzie będzie macierzą tego samego typu z kolejnymi elementami napięcia \scriptstyle v_2 oraz natężenia \scriptstyle i_1 wyjściowego elementu. Zachowanie elementu elektronicznego da się opisać wzorem \scriptstyle \mathbf B = \mathbf{HA}, gdzie \scriptstyle \mathbf H jest macierzą typu \scriptstyle 2 \times 2 zawierającą impedancję (zawadę) oraz admitancję (drożność) kolejno jako elementy antyprzekątnej głównej oraz dwa elementy bezwymiarowe na przekątnej głównej. Rozwiązanie obwodu sprowadza się wówczas do mnożenia macierzy.

Historia

Za pierwsze macierze da się uważać kwadraty magiczne \scriptstyle 3 \times 3, które w literaturze chińskiej pojawiają się już ok. 650 p.n.e.[19]. Kwadraty magiczne były znane także arabskim matematykom, prawdopodobnie już w VII wieku, kiedy Arabowie podbili północnozachodnie części subkontynentu indyjskiego przejmując zdobycze matematyki oraz astronomii hinduskiej − być może idea ta dotarła do nich z Chin. Pierwsze kwadraty magiczne rzędu 5 oraz 6 pojawiły się w Encyklopedii Bractwa Czystości (arab. رسائل أخوان الصفا و خلان الوفا) z Bagdadu około 983 roku. Prostsze kwadraty magiczne były znane wielu wcześniejszym matematykom arabskim[19].

Powstały pomiędzy III wiekiem p.n.e. a II wiekiem n.e. traktat Dziewięć rozdziałów o sztuce matematyki (Jiu Zhang Suan Shu) jest pierwszym zanotowanym przypadkiem użycia macierzy do rozwiązania układów równań liniowych[20] W rozdziale siódmym, Zbyt dużo oraz nie wystarczająco, po raz pierwszy wprowadzono koncepcję wyznacznika, przeszło 1000 lat przed jego publikacją przez Kōwę Sekiego w 1683 roku oraz Gottfrieda Leibniza w 1693 roku. Gabriel Cramer opublikował swoje wzory dające pełny algorytm rozwiązywania układów równań liniowych dopiero w 1750 roku.

Wczesna teoria macierzy bardziej niż na same macierze kładła nacisk na wyznaczniki − niezależne pojęcie macierzy bliskie współczesnemu ukazało się dopiero w 1858 roku w pracy Arthura Cayleya „Pamiętnik o teorii macierzy” (Memoir on the theory of matrices). Słowo „macierz” (łac. matrix − samica rozpłodowa, roślina macierzysta; od matr-, mater − matka; niegdyś właśnie „macierz”) ukuł James Joseph Sylvester, który macierz rozumiał jako obiekt dający wyznaczniki znane dzisiaj jako minory (zob. Wyznacznik)[21] W pracy z 1851 roku Sylvester tłumaczy:

„W poprzednich pracach zdefiniowałem «Macierz» jako prostokątną tablicę wyrazów, z której jak z łona jednego rodzica wyłonić da się przeróżne układy wyznaczników”[22]

Badania nad wyznacznikami rozpoczęto z kilku powodów: problemy teorii liczb doprowadziły Carla Friedricha Gaussa do związania współczynników form kwadratowych, tzn. wyrażeń postaci \scriptstyle x^2 + xy - 2y^2, oraz trójwymiarowych przekształceń liniowych z macierzami. Gotthold Eisenstein rozwinął te pojęcia w dalszym stopniu, w tym fakt, iż (w języku współczesnym) iloczyny macierzy nie są przemienne. Augustin Cauchy jako pierwszy udowodnił ogólne twierdzenia o wyznacznikach korzystając z nastepującej definicji wyznacznika macierzy \scriptstyle \mathbf A = [a_{ij}]: zastąp w wielomianie \scriptstyle a_1 \dots a_n \prod_{i < j} (a_j - a_i) potęgi \scriptstyle a_j^k wyrazem \scriptstyle a_{jk}, gdzie \scriptstyle \prod oznacza iloczyn wskazanych wyrazów. Wykazał on także w 1829 roku, że wartości własne macierzy symetrycznych są rzeczywiste. Carl Gustav Jakob Jacobi badał „wyznaczniki funkcyjne”, nazywane później przez Sylvestera wyznacznikami Jacobiego, za pomocą których możliwy jest opis przekształceń geometrycznych na poziomie lokalnym (lub infinitezymalnym); w dziełach Leopolda Kroneckera „Wykłady o teorii wyznaczników” (Vorlesungen über die Theorie der Determinanten) oraz Karla Weierstrassa „O teorii wyznaczników” (Zur Determinantentheorie), obu opublikowanych w 1903 roku, po raz pierwszy opisano wyznaczniki w sposób aksjomatyczny, w przeciwieństwie do mniej abstrakcyjnego podejścia stosowanego przez Cauchy'ego. Rok ten przyjmuje się jako datę precyzyjnego ustalenia definicji wyznacznika.

Oryginalnie wiele twierdzeń udowodniono dla małych macierzy, przykładowo Cayley dowiódł twierdzenie Cayleya-Hamiltona w przypadku macierzy typu \scriptstyle 2 \times 2 oraz przez Williama Rowana Hamiltona dla macierzy typu \scriptstyle 4 \times 4. Georg Frobenius, rozwijając teorię form dwuliniowych, uogólnił twierdzenie na macierze dowolnego typu (1898). Również pod koniec XIX wieku Wilhelm Jordan przedstawił metodę rozwiązywania układów równań liniowych znaną dziś jako metoda eliminacji Gaussa-Jordana (jako uogólnienie przypadku szczególnego znanego dziś jako metoda eliminacji Gaussa, przy czym Gauss, którego nazwisko noszą obie procedury, nie wniósł wkładu w rozwój żadnej z nich). Z początkiem XX wieku macierze osiągnęły swoją kluczową pozycję w algebrze liniowej (częściowo dzięki ich wykorzystaniu przy klasyfikacji układów liczb hiperzespolonych w poprzednim stuleciu).

Powstanie mechaniki macierzowej dzięki wysiłkom Wernera Heisenberga, Maksa Borna oraz Pascuala Jordana doprowadziły do badań nad macierzami o nieskończonej liczbie wierszy oraz kolumn. W dalszej kolejności John von Neumann dał matematyczny opis mechaniki kwantowej rozwinąwszy takie pojęcia analizy funkcjonalnej jak operator liniowy na przestrzeniach Hilberta, które zgrubnie rzecz ujmując, odpowiadają przestrzeniom euklidesowym o nieskończenie wielu niezależnych kierunkach.

Samo słowo „macierz” stosowane było w kontekście matematycznym w niestandardowy sposób przynajmniej przez dwóch, ważnych historycznie autorów.

Bertrand Russell oraz Alfred North Whitehead w ich Principia Mathematica (1910–1913) wykorzystują słowo „macierz” w kontekście wprowadzonego przez nich aksjomatu redukowalności. Zaproponowali oni ten aksjomat w celu zredukowania dowolnej funkcji do funkcji niższego typu tak, by „na dnie” (typ 0) funkcja była identyczna ze swoim rozszerzeniem:

Macierzą nazwiemy dowolną funkcję, jakkolwiek wielu zmiennych, która nie wykorzystuje żadnych zmiennych pozornych. Wówczas dowolną możliwą funkcję inna od macierzy da się otrzymać za pomocą uogólnienia, tzn. rozpatrzenia sądu zapewniającego, iż rzeczona funkcja jest prawdziwa dla wszystkich możliwych wartości bądź dla pewnej wartości jednego z argumentów pozostały argument albo argumenty pozostają nieokreślone”[23].

Dla przykładu funkcja \scriptstyle \Phi(x, y) dwóch zmiennych \scriptstyle x oraz \scriptstyle y bywa zredukowana do kolekcji funkcji jednej zmiennej, tzn. \scriptstyle y poprzez „rozpatrywanie” funkcji wszystkich możliwych wartości „indywiduów” \scriptstyle a_i podstawionych w miejsce zmiennej \scriptstyle x. Uzyskana kolekcja funkcji jednej zmiennej \scriptstyle y, tzn. \scriptstyle \forall a_i\colon \Phi(a_i, y) bywa zredukowana do „macierzy” wartości „rozpatrując” funkcję dla wszystkich wartości „indywiduów” \scriptstyle b_i wstawionych w miejsce zmiennej \scriptstyle y, tzn. \scriptstyle \forall b_j\; \forall a_i\colon \Phi(a_i, b_j).

Alfred Tarski w swoim „Wprowadzeniu do logiki” (Introduction to Logic) z 1946 roku używał słowa „macierz” mając na myśli tabelę prawdy wykorzystywaną w logice matematycznej[24].

Sprawdź też

WiktionaryPl nodesc.svg
Sprawdź hasło macierz w Wikisłowniku

Przypisy

  1. za A. Cayley A Memoir on the Theory of Matrices (1855) w formacie .pdf
  2. za A. Cayley Mémoire sur les Hyperdéterminants, Crelle Journal 30 (1846) w formacie .pdf
  3. Niegdyś do rozwiązywania układów równań liniowych stosowało się (wprowadzone przez polskiego astronoma Tadeusza Banachiewicza) tzw. krakowiany, czyli macierze z działaniem mnożenia podobnym do iloczynu Cauchy'ego, w którym dany element jest sumą iloczynów kolejnych elementów kolumn (a nie kolumny oraz wiersza) − w szczególności nie jest ono przemienne, ani łączne. Podejście to upraszcza jednak wiele wzorów, usprawnia obliczenia numeryczne przy obliczeniach ręcznych oraz z zastosowaniem komputerów z pamięcią sekwencyjną oraz ułatwia sprawdzanie obliczeń poprzez sumy kontrolne; zob. też mnożenie macierzy.
  4. Ogólnie: \scriptstyle n-wymiarowej objętości (mierze) obrazu \scriptstyle n-wymiarowej kostki (\scriptstyle n-wymiarowego prostopadłościanu/przedziału jednostkowego), tzn. pewnego \scriptstyle n-wymiarowego równoległościanu.
  5. Tzn. permutuje wektory bazy uporządkowanej (bądź rozpinające \scriptstyle n-wymiarowy równoległościan) za pomocą nieparzystej liczby transpozycji.
  6. Zob. sekcję Macierze puste
  7. Ponadto \scriptstyle \mathrm p_\mathbf A(t) = t^n - a_1 t^{n-1} + \dots + (-1)^n a_n, gdzie \scriptstyle a_i oznacza sumę wszystkich minorów głównych \scriptstyle i-tego stopnia danej macierzy (por. wzory Viète'a); w szczególności \scriptstyle a_1 = \mathrm tr(\mathbf A) oraz \scriptstyle a_n = \det(\mathbf A) (oraz \scriptstyle a_0 = 1, zob. macierz pusta).
  8. W szczególności: macierz jest nieosobliwa, jeśli wszystkie jej wartości własne są zróżnicowane od zera.
  9. W przypadku dwuwymiarowym – symetrii osiowych, w przypadku trójwymiarowym – symetrii płaszczyznowych, w ogólności – symetrii względem hiperpłaszczyzny.
  10. W innej postaci: jeśli \scriptstyle D_i oznacza wiodący minor główny, to wartości własne \scriptstyle \lambda_i = D_i/D_{i-1}; zgodnie z sekcją Macierze puste, \scriptstyle D_0 = 1.
  11. Definicję tę da się rozszerzyć o tzw. macierze puste: wystarczy, by zbiór wskaźników był pusty.
  12. Przestrzenie \scriptstyle \{s\} \times Z oraz \scriptstyle Z \times \{t\} da się w naturalny sposób utożsamiać z przestrzenią \scriptstyle Z poprzez rzuty; w tym wypadku chodzi o utożsamienie wektorów postaci \scriptstyle (s, z), (z, t) przy ustalonych \scriptstyle s, t oraz skalara \scriptstyle z.
  13. Dolne „piętro” diagramu da się zastąpić przekształceniem w postaci macierzy \scriptstyle \mathbf T_A^B pomiędzy macierzowymi przestrzeniami współrzędnych \scriptstyle \mathrm{Mat}_{n \times 1} oraz \scriptstyle \mathrm{Mat}_{m \times 1} wektorów kolumnowych bądź \scriptstyle \mathrm{Mat}_{1 \times n} oraz \scriptstyle \mathrm{Mat}_{1 \times m} wektorów wierszowych.
  14. Z punktu widzenia teorii kategorii kategorie skończeniewymiarowych przestrzeni liniowych oraz przestrzeni macierzy nad wspólnym ciałem są równoważne; kategoria skończeniewymiarowych przestrzeni liniowych jest równoważna z podkategorią skończeniewymiarowych przestrzeni współrzędnych.
  15. Za bazę da się wybrać zbiór macierzy, których elementami są jedna jedynka oraz same zera.
  16. W przypadku, kiedy pierścień nie jest przemienny, zwykle nie da się przedstawić sensownej definicji; nieraz jednak jest to możliwe, np. wyznacznik Dieudonnégo dla pierścieni z dzieleniem oraz jego uogólnienie, funktor Dieudonnégo, na algebry centralne proste.
  17. Tzn. w dowolnym izomorfizmie \scriptstyle \mathrm{Mat}_n(K) \to K^{n^2}.
  18. Bądź z twierdzenia o przekształceniu uwikłanym.
  19. 19,0 19,1 Swaney, Mark. History of Magic Squares
  20. Shen Kangshen et al. (ed.): Nine Chapters of the Mathematical Art, Companion and Commentary. Oxford University Press, 1999.  cytowane przez Otto Bretscher: Linear Algebra with Applications. Wyd. 3. Prentice-Hall, 2005, s. 1. 
  21. OED pierwsze użycie słowa „macierz” (tzn. „matrix”) w kontekście matematycznym przypisuje Sylvesterowi cytując London, Edinb. & Dublin Philos. Mag. 37 (1850), s. 369: „«Wyjdziemy» od podłużnego układu wyrazów składającego się, załóżmy, z m wierszy oraz n kolumn. Nie będzie on sam sobie oznaczał wyznacznika, ale będzie on jak gdyby Macierzą, z której będziemy tworzyć różnorakie wyznaczniki poprzez ustalenie liczby p oraz wybranie zgodnie z wolą p wierszy oraz p kolumn, kwadraty im odpowiadające nazywane będą wyznacznikami p-tego stopnia [dosł. rzędu].” (We "commence" with an oblong arrangement of terms consisting, suppose, of m lines and n columns. This will not in itself represent a determinant, but is, as it were, a Matrix out of which we may form various systems of determinants by fixing upon a number p, and selecting at will p lines and p columns, the squares corresponding to which may be termed determinants of the pth order.)
  22. I have in previous papers defined a "Matrix" as a rectangular array of terms, out of which different systems of determinants may be engendered as from the womb of a common parent za The Collected Mathematical Papers of James Joseph Sylvester: 1837–1853, Paper 37, s. 247
  23. Let us give the name of matrix to any function, of however many variables, which does not involve any apparent variables. Then any possible function other than a matrix is derived from a matrix by means of generalization, i.e., by considering the proposition which asserts that the function in question is true with all possible values or with some value of one of the arguments, the other argument or arguments remaining undetermined za Alfred North Whitehead and Bertrand Russell (1913) Principia Mathematica to *56, Cambridge at the University Press, Cambridge UK (wznowienie z 1962 roku) s. 162ff.
  24. Tarski, Alfred 1946 Introduction to Logic and the Methodology of Deductive Sciences, Dover Publications, Inc, New York NY, ISBN 0-486-28462-X.

Bibliografia

Linki zewnętrzne

vseo.pl