Quadratwurzel einer Matrix

Die Quadratwurzel einer Matrix oder Matrixwurzel ist ein Begriff aus der linearen Algebra und verallgemeinert das Konzept der Quadratwurzel einer reellen Zahl. Eine Quadratwurzel einer quadratischen Matrix ist eine Matrix, die mit sich selbst multipliziert die Ausgangsmatrix ergibt. Für symmetrische positiv semidefinite Matrizen lässt sich eine eindeutige Quadratwurzel definieren. Im Allgemeinen muss allerdings weder eine Quadratwurzel existieren, noch muss sie, wenn sie existiert, eindeutig sein.

Quadratwurzel einer positiv semidefiniten Matrix

Definition

Für eine symmetrische positiv semidefinite Matrix A R n × n {\displaystyle A\in \mathbb {R} ^{n\times n}} heißt eine ebenfalls symmetrische positiv semidefinite Matrix B R n × n {\displaystyle B\in \mathbb {R} ^{n\times n}} Quadratwurzel oder kurz Wurzel von A , {\displaystyle A,} falls

B 2 = B B = A {\displaystyle B^{2}=B\cdot B=A}

gilt.[1] Die Quadratwurzel von A {\displaystyle A} ist dabei eindeutig bestimmt und wird mit A 1 2 {\displaystyle A^{\frac {1}{2}}} bezeichnet.

Darstellung

Die Quadratwurzel von A {\displaystyle A} ergibt sich wie folgt. Nach dem Spektralsatz existiert eine orthogonale Matrix

Q = ( v 1 v n ) R n × n {\displaystyle Q=(v_{1}\mid \cdots \mid v_{n})\in \mathbb {R} ^{n\times n}}

mit paarweise orthonormalen Eigenvektoren v 1 , , v n R n {\displaystyle v_{1},\ldots ,v_{n}\in \mathbb {R} ^{n}} von A {\displaystyle A} als Spalten und eine Diagonalmatrix

D = diag ( d 1 , , d n ) R n × n {\displaystyle D=\operatorname {diag} (d_{1},\ldots ,d_{n})\in \mathbb {R} ^{n\times n}}

mit den diesen Eigenvektoren zugehörigen Eigenwerten d 1 , , d n R {\displaystyle d_{1},\ldots ,d_{n}\in \mathbb {R} } auf der Diagonale, sodass

A = Q D Q T {\displaystyle A=QDQ^{T}}

gilt. Die Quadratwurzel von A {\displaystyle A} ergibt sich dann zu

A 1 2 = Q D 1 2 Q T , {\displaystyle A^{\frac {1}{2}}=QD^{\frac {1}{2}}Q^{T},}

wobei die Diagonalmatrix

D 1 2 = diag ( d 1 , , d n ) R n × n {\displaystyle D^{\frac {1}{2}}={\text{diag}}\left({\sqrt {d_{1}}},\ldots ,{\sqrt {d_{n}}}\right)\in \mathbb {R} ^{n\times n}}

die Quadratwurzeln der Eigenwerte von A {\displaystyle A} auf der Diagonale hat.[1] Nachdem die Eigenwerte einer positiv semidefiniten Matrix A {\displaystyle A} stets reell und nichtnegativ sind, können deren Quadratwurzeln ebenfalls reell und nichtnegativ gewählt werden.

Beispiel

Die Matrix

A = ( 5 4 4 5 ) {\displaystyle A={\begin{pmatrix}5&4\\4&5\end{pmatrix}}}

hat die Eigenwerte λ 1 = 9 {\displaystyle \lambda _{1}=9} und λ 2 = 1. {\displaystyle \lambda _{2}=1.} v 1 = 1 2 ( 1 1 ) {\displaystyle v_{1}={\tfrac {1}{\sqrt {2}}}{\begin{pmatrix}1\\1\end{pmatrix}}} und v 2 = 1 2 ( 1 1 ) {\displaystyle v_{2}={\tfrac {1}{\sqrt {2}}}{\begin{pmatrix}1\\-1\end{pmatrix}}} bilden die zugehörige Orthonormalbasis aus Eigenvektoren. Es gilt also

A = 1 2 ( 1 1 1 1 ) ( 9 0 0 1 ) 1 2 ( 1 1 1 1 ) {\displaystyle A={\frac {1}{\sqrt {2}}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}{\begin{pmatrix}9&0\\0&1\end{pmatrix}}{\frac {1}{\sqrt {2}}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}}

zusammengefasst zu

A = 1 2 ( 1 1 1 1 ) ( 9 0 0 1 ) ( 1 1 1 1 ) {\displaystyle A={\frac {1}{2}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}{\begin{pmatrix}9&0\\0&1\end{pmatrix}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}}

und somit

A 1 2 = 1 2 ( 1 1 1 1 ) ( 3 0 0 1 ) ( 1 1 1 1 ) = ( 2 1 1 2 ) . {\displaystyle A^{\frac {1}{2}}={\frac {1}{2}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}{\begin{pmatrix}3&0\\0&1\end{pmatrix}}{\begin{pmatrix}1&1\\1&-1\end{pmatrix}}={\begin{pmatrix}2&1\\1&2\end{pmatrix}}.}

Eigenschaften

Das Quadrat der Matrix A 1 2 {\displaystyle A^{\frac {1}{2}}} ist die Matrix A : {\displaystyle A\colon }

A 1 2 A 1 2 = Q D 1 2 Q T Q D 1 2 Q T = Q D Q T = A {\displaystyle A^{\frac {1}{2}}A^{\frac {1}{2}}=QD^{\frac {1}{2}}Q^{T}QD^{\frac {1}{2}}Q^{T}=QDQ^{T}=A}

Die Matrix A 1 2 {\displaystyle A^{\frac {1}{2}}} ist symmetrisch:

( A 1 2 ) T = ( Q D 1 2 Q T ) T = Q D 1 2 Q T = A 1 2 {\displaystyle \left(A^{\frac {1}{2}}\right)^{T}=\left(QD^{\frac {1}{2}}Q^{T}\right)^{T}=QD^{\frac {1}{2}}Q^{T}=A^{\frac {1}{2}}}

Die Matrix A 1 2 {\displaystyle A^{\frac {1}{2}}} ist positiv semidefinit (verwendet wird die Verschiebungseigenschaft des Standardskalarprodukts):

x , A 1 2 x = x , Q D 1 2 Q T x = D 1 4 Q T x , D 1 4 Q T x 0 {\displaystyle \left\langle x,A^{\frac {1}{2}}x\right\rangle =\left\langle x,QD^{\frac {1}{2}}Q^{T}x\right\rangle =\left\langle D^{\frac {1}{4}}Q^{T}x,D^{\frac {1}{4}}Q^{T}x\right\rangle \geq 0}

für alle x R n , {\displaystyle x\in \mathbb {R} ^{n},} wobei D 1 4 = diag ( d 1 4 , , d n 4 ) {\displaystyle D^{\frac {1}{4}}={\text{diag}}\left({\sqrt[{4}]{d_{1}}},\ldots ,{\sqrt[{4}]{d_{n}}}\right)} gilt. Ist A {\displaystyle A} positiv definit, so ist auch A 1 2 {\displaystyle A^{\frac {1}{2}}} positiv definit.

Quadratwurzeln beliebiger Matrizen

Definition

Als Wurzel einer quadratischen Matrix A {\displaystyle A} bezeichnet man jede Matrix B , {\displaystyle B,} die mit sich selbst multipliziert A {\displaystyle A} ergibt:

B  ist Wurzel von  A B 2 = B B = A {\displaystyle B{\text{ ist Wurzel von }}A\quad \Leftrightarrow \quad B^{2}=BB=A}

Man findet auch Quellen, in denen B {\displaystyle B} eine Wurzel von A {\displaystyle A} genannt wird, wenn A = B B T {\displaystyle A=B\cdot B^{T}} gilt.

Für eine Wurzel von A {\displaystyle A} schreibt man auch A 1 2 . {\displaystyle A^{\frac {1}{2}}.} Es ist in dieser Notation jedoch unklar, welche Wurzel gemeint ist, da mehrere existieren können.

Anzahl existierender Wurzeln

Wie schon bei der Wurzel aus reellen oder komplexen Zahlen ist die Wurzel aus einer Matrix im Allgemeinen nicht eindeutig. Ist etwa A 1 2 {\displaystyle A^{\frac {1}{2}}} eine Wurzel aus A , {\displaystyle A,} dann auch A 1 2 . {\displaystyle -A^{\frac {1}{2}}.}

Anders als bei der Wurzel einer komplexen Zahl können Matrizen auch mehr als zwei Wurzeln haben.

So haben beispielsweise n × n {\displaystyle n\times n} -Matrizen, deren charakteristisches Polynom in paarweise verschiedene Linearfaktoren zerfällt, bis zu 2 n {\displaystyle 2^{n}} verschiedene Wurzeln.

Es gibt sogar Matrizen mit unendlich vielen Wurzeln. So besitzt etwa die Einheitsmatrix ( 1 0 0 1 ) {\displaystyle {\bigl (}{\begin{smallmatrix}1&0\\0&1\end{smallmatrix}}{\bigr )}} unter anderem ( 1 z 0 1 ) {\displaystyle {\bigl (}{\begin{smallmatrix}1&z\\0&-1\end{smallmatrix}}{\bigr )}} für jede komplexe Zahl z {\displaystyle z} als Wurzel.

Weiterhin gibt es Matrizen, für die überhaupt keine Wurzel existiert: Ein Beispiel ist A = ( 0 1 0 0 ) . {\displaystyle A={\bigl (}{\begin{smallmatrix}0&1\\0&0\end{smallmatrix}}{\bigr )}.}

Geometrische Interpretation von Wurzeln

Betrachtet man die Matrix A {\displaystyle A} als lineare Transformation, das heißt als eine Abbildung zwischen Vektorräumen, durch die einem Vektor v {\displaystyle {\vec {v}}} ein Vektor v = A v {\displaystyle {\vec {v}}'=A{\vec {v}}} zugeordnet wird, dann ist eine Wurzel A 1 2 {\displaystyle A^{\frac {1}{2}}} eine Transformation, die man zweimal hintereinander ausführen muss, um v {\displaystyle {\vec {v}}} in v {\displaystyle {\vec {v}}'} überzuführen.

Beispiel:

A {\displaystyle A} sei die zweidimensionale Rotationsmatrix mit dem Winkel α : {\displaystyle \alpha \colon }

A = ( cos α sin α sin α cos α ) {\displaystyle A={\begin{pmatrix}\cos \alpha &-\sin \alpha \\\sin \alpha &\cos \alpha \end{pmatrix}}}

Dann ist jede zu einem Winkel ( t 360 + α ) / 2 {\displaystyle (t\cdot 360^{\circ }+\alpha )/2} mit einer ganzen Zahl t {\displaystyle t} gehörende Rotationsmatrix eine Wurzel von A . {\displaystyle A.} Für t = 0 {\displaystyle t=0} erreicht man mit der ersten Multiplikation eines Vektors v {\displaystyle {\vec {v}}} mit A 1 2 {\displaystyle A^{\frac {1}{2}}} eine Drehung um den halben Winkel α / 2 {\displaystyle \alpha /2} und mit der zweiten Multiplikation noch einmal.

Berechnung einer Wurzel

Man kann Wurzeln einer Matrix A {\displaystyle A} der Größe n × n {\displaystyle n\times n} leicht bestimmen, wenn A {\displaystyle A} eine Diagonalmatrix ist oder sich zumindest in eine Diagonalform überführen lässt (siehe Diagonalisierung).

Fall 1: Diagonalmatrix

Sind die Diagonaleinträge einer Diagonalmatrix paarweise verschieden, so können alle Wurzeln der Diagonalmatrix einfach bestimmt werden, indem von jedem Eintrag auf der Hauptdiagonale eine Wurzel bestimmt wird. Wenn man die Diagonaleinträge von A {\displaystyle A} wie üblich mit a 11 , , a n n {\displaystyle a_{11},\dotsc ,a_{nn}} bezeichnet, erhält man damit als Wurzeln von A {\displaystyle A} die Matrizen

( ± a 11 0 0 0 ± a 22 0 0 0 ± a n n ) {\displaystyle {\begin{pmatrix}\pm {\sqrt {a_{11}}}&0&\cdots &0\\0&\pm {\sqrt {a_{22}}}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\dots &\pm {\sqrt {a_{nn}}}\end{pmatrix}}}

Für jedes der n {\displaystyle n} Diagonalelemente kann man das Vorzeichen beliebig wählen, sodass man 2 n {\displaystyle 2^{n}} paarweise verschiedene Wurzeln erhält, falls alle Diagonaleinträge von Null verschieden sind. Ist ein Diagonaleintrag Null, so erhält man entsprechend 2 n 1 {\displaystyle 2^{n-1}} paarweise verschiedene Wurzeln. Da die Matrix A {\displaystyle A} auch negative Werte auf der Diagonalen besitzen kann, können die Wurzeln auch komplexe Zahlen beinhalten.

Es ist zu beachten, dass es noch weitere Wurzeln geben kann, wenn die Diagonaleinträge nicht paarweise verschieden sind. Diese sind dann jedoch keine Diagonalmatrizen. So hat etwa die Einheitsmatrix unendlich viele Wurzeln, wie bereits oben erklärt wurde. Diagonalmatrizen mit negativen Diagonaleinträgen können in diesem Fall auch reelle Wurzeln besitzen. Zum Beispiel gilt:

( 0 1 1 0 ) 2 = ( 1 0 0 1 ) {\displaystyle {\begin{pmatrix}0&1\\-1&0\end{pmatrix}}^{2}={\begin{pmatrix}-1&0\\0&-1\end{pmatrix}}}

Fall 2: Diagonalisierbare Matrix

Ist die Matrix A {\displaystyle A} diagonalisierbar, so kann man auf folgende Weise Wurzeln von A {\displaystyle A} ermitteln:

Man bestimmt zunächst eine invertierbare Matrix T {\displaystyle T} und eine Diagonalmatrix D {\displaystyle D} , sodass A = T D T 1 {\displaystyle A=TDT^{-1}} gilt. Die Matrix T {\displaystyle T} hat dann als Spalten Eigenvektoren der Matrix A {\displaystyle A} und die Matrix D {\displaystyle D} als Diagonaleinträge die zugehörigen Eigenwerte.

Ist nun D 1 2 {\displaystyle D^{\frac {1}{2}}} eine Wurzel von D , {\displaystyle D,} so ist A 1 2 := T D 1 2 T 1 {\displaystyle A^{\frac {1}{2}}:=TD^{\frac {1}{2}}T^{-1}} eine Wurzel der Matrix A {\displaystyle A} , denn es gilt:

( T D 1 2 T 1 ) 2 = T D 1 2 T 1 T D 1 2 T 1 = T D 1 2 D 1 2 T 1 = T D T 1 = A {\displaystyle (TD^{\frac {1}{2}}T^{-1})^{2}=TD^{\frac {1}{2}}T^{-1}TD^{\frac {1}{2}}T^{-1}=TD^{\frac {1}{2}}D^{\frac {1}{2}}T^{-1}=TDT^{-1}=A}

Da D {\displaystyle D} eine Diagonalmatrix ist, erhält man mögliche Wurzeln wie in Fall 1. Auch hierbei ist zu beachten, dass manche Eigenwerte der Diagonalmatrix negativ sein können, deren Wurzeln sind dann komplex. Falls die Matrix n {\displaystyle n} paarweise verschiedene Eigenwerte hat, erhält man auch wie in Fall 1 2 n {\displaystyle 2^{n}} bzw. 2 n 1 {\displaystyle 2^{n-1}} verschiedene Lösungen.

Fall 3: Nicht diagonalisierbare Matrix

Ist die Matrix A {\displaystyle A} nicht diagonalisierbar, lässt sich mit dem gezeigten Verfahren keine Wurzel berechnen. Dies bedeutet aber nicht, dass A {\displaystyle A} keine Wurzel besitzt: So ist beispielsweise die Scherungs-Matrix A = ( 1 2 0 1 ) {\displaystyle A={\bigl (}{\begin{smallmatrix}1&2\\0&1\end{smallmatrix}}{\bigr )}} nicht diagonalisierbar, besitzt jedoch die Wurzel ( 1 1 0 1 ) . {\displaystyle {\bigl (}{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}{\bigr )}.}

Falls wir beim Rechnen komplexe Zahlen zulassen, so ist jede Matrix A {\displaystyle A} auf jordansche Normalform transformierbar, auch wenn sie nicht diagonalisierbar ist.

Man bestimmt Matrizen Q , {\displaystyle Q,} ihre Inverse Q 1 {\displaystyle Q^{-1}} und J {\displaystyle J} mit J = Q 1 A Q , {\displaystyle J=Q^{-1}AQ,} wobei J {\displaystyle J} die folgende Blockdiagonalform hat:

J = ( J 1 0 0 J k ) {\displaystyle J={\begin{pmatrix}J_{1}&&0\\&\ddots &\\0&&J_{k}\end{pmatrix}}}

Die J i {\displaystyle J_{i}} sind Jordan-Blöcke der Form

J i = ( λ i 1 0 λ i 1 λ i 1 0 λ i ) . {\displaystyle J_{i}={\begin{pmatrix}\lambda _{i}&1&&&0\\&\lambda _{i}&1&&\\&&\ddots {}&\ddots {}\\&&&\lambda _{i}&1\\0&&&&\lambda _{i}\end{pmatrix}}.}

Eine Wurzel aus A {\displaystyle A} berechnet sich gemäß

A = A 1 2 A 1 2 = Q J Q 1 = Q J 1 2 J 1 2 Q 1 = ( Q J 1 2 Q 1 ) ( Q J 1 2 Q 1 ) A 1 2 = Q J 1 2 Q 1 . {\displaystyle A=A^{\frac {1}{2}}A^{\frac {1}{2}}=QJQ^{-1}=QJ^{\frac {1}{2}}J^{\frac {1}{2}}Q^{-1}=(QJ^{\frac {1}{2}}Q^{-1})(QJ^{\frac {1}{2}}Q^{-1})\Rightarrow A^{\frac {1}{2}}=QJ^{\frac {1}{2}}Q^{-1}.}

Die Wurzel aus J {\displaystyle J} ist aus jedem Jordan-Block J i {\displaystyle J_{i}} einzeln zu ziehen.

Falls λ i 0 {\displaystyle \lambda _{i}\,\neq \,0} gilt, ist die Potenz J i β {\displaystyle J_{i}^{\beta }} eines Jordan-Blocks J i {\displaystyle J_{i}} durch

J i β = ( α i 0 α i 1 α i 2 α i 3 0 α i 0 α i 1 α i 2 0 0 α i 0 α i 1 0 0 0 α i 0 ) {\displaystyle J_{i}^{\beta }={\begin{pmatrix}\alpha _{i0}&\alpha _{i1}&\alpha _{i2}&\alpha _{i3}\\0&\alpha _{i0}&\alpha _{i1}&\alpha _{i2}\\0&0&\alpha _{i0}&\alpha _{i1}\\0&0&0&\alpha _{i0}\end{pmatrix}}}

gegeben mit α i j = 1 j ! f ( j ) ( λ i ) , {\displaystyle \alpha _{ij}={\tfrac {1}{j!}}f^{(j)}(\lambda _{i}),} wobei f ( j ) {\displaystyle f^{(j)}} die j {\displaystyle j} -te Ableitung der Potenzfunktion f ( x ) = x β {\displaystyle f(x)=x^{\beta }} ist. Explizit ergibt sich α i j = Γ ( β + 1 ) λ i β j Γ ( j + 1 ) Γ ( β j + 1 ) {\displaystyle \alpha _{ij}={\frac {\Gamma (\beta +1)\lambda _{i}^{\beta -j}}{\Gamma (j+1)\Gamma (\beta -j+1)}}} und j = 0 , 1 , , ( m i 1 ) , {\displaystyle j=0,1,\dotsc ,(m_{i}-1),} wobei die Größe des Jordan-Blocks J i {\displaystyle J_{i}} mit m i {\displaystyle m_{i}} (in der Darstellung m i = 4 {\displaystyle m_{i}=4} ), die Subdiagonalen mit j {\displaystyle j} ( j = 0 {\displaystyle j=0} ist die Diagonale) und die Gammafunktion mit Γ {\displaystyle \Gamma } bezeichnet sind. Für die Quadratwurzel ist β = 1 / 2 {\displaystyle \beta =1/2} zu setzen.

Für m i = 2 {\displaystyle m_{i}=2} ergibt sich also beispielsweise

J i 1 2 = ( λ i 1 2 λ i 0 λ i ) . {\displaystyle J_{i}^{\frac {1}{2}}={\begin{pmatrix}{\sqrt {\lambda _{i}}}&{\frac {1}{2{\sqrt {\lambda _{i}}}}}\\0&{\sqrt {\lambda _{i}}}\end{pmatrix}}.}

Falls λ i = 0 {\displaystyle \lambda _{i}=0} und gleichzeitig m i > 1 {\displaystyle m_{i}>1} gilt, existiert die Wurzel aus dem Jordan-Block J i {\displaystyle J_{i}} nicht.

Außerhalb der Jordan-Blöcke stehen lauter Nullen.

Falls λ i 0 , {\displaystyle \lambda _{i}\neq 0,} so hat die Zahl λ i {\displaystyle \lambda _{i}} zwei Wurzeln, daher erhält man auf diese Weise für jeden Jordan-Block J i {\displaystyle J_{i}} zwei verschiedene Wurzeln. So entstehen durch Kombination 2 k {\displaystyle 2^{k}} Wurzeln, wobei k {\displaystyle k} die Anzahl der Jordan-Blöcke J i {\displaystyle J_{i}} bezeichnet.

Mit diesem Verfahren bekommt man im Allgemeinen nur einige und nicht alle Quadratwurzeln einer Matrix.

Siehe auch

Einzelnachweise

  1. a b Christian Kanzow: Numerik linearer Gleichungssysteme. Direkte und iterative Verfahren. Springer-Verlag, Berlin / Heidelberg / New York 2005, S. 13–15.