行列指数関数の性質(メモ)

行列指数関数に対して次の性質が成り立ちます。



\[
\begin{align}
&\exp O=E\\
\nonumber\\
&\exp A\exp B=\exp(A+B)\;(AB=BA\text{のとき})\\
\nonumber\\
&\exp X\exp (-X)=E
\end{align}
\]


\((1)\)は行列指数関数の定義から明らかです。
\((2)\)は簡単に証明できて、\(AB=BA\)より

\[
\begin{align}
\text{(左辺)}&=\sum_{i=0}^\infty\sum_{j=0}^\infty \frac{A^i}{i!}\frac{B^j}{j!}\\
&=\sum_{n=0}^\infty\sum_{i=0}^{n}\frac{A^i}{i!}\frac{B^{n-i}}{(n-i)!}\\
&=\sum_{n=0}^\infty\sum_{i=0}^{n}\frac{1}{n!}\frac{n!}{i!(n-i)!} A^iB^{n-i}\\
&=\sum_{n=0}^\infty\frac{1}{n!}\left(\sum_{i=0}^{n}\frac{n!}{i!(n-i)!} A^iB^{n-i}\right)\\
&=\sum_{n=0}^\infty\frac{1}{n!}(A+B)^n\\
\nonumber&=\text{(右辺)}
\end{align}
\]

\((3)\)は\((1),(2)\)からすぐ導けます。

行列の正則関数(メモ)

前回の記事
行列の指数関数について(メモ) - MAEA2’s diary

の\( (11) \)式からわかるように、行列の指数関数の性質について調べるには、各ジョルダンブロックの

指数関数について調べればよいことがわかりました。

行列の指数関数は、\(\exp(z)\)の展開式から定義しました。

これはべき級数の形をしています。

そこで一般のべき級数についても前回の記事と同じ結果が導けるのでそれを示しておきます。

いま、複素べき級数

\[
\begin{align}
f(z)=\sum_{n=0}^\infty a_nz^n\; (z\in\mathbb{C})
\end{align}
\]

に対して、行列べき級数

\[
\begin{align}
f(A)=\sum_{n=0}^\infty a_nA^n\; (A\in M_n(\mathbb{C}))
\end{align}
\]

で定義します。

これに対してもジョルダン標準形による分解ができて, \( P:\text{正則} \)があって

\[
\begin{align}
\nonumber f(A)&=P\left(\sum_{n=0}^\infty a_n\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}J(\lambda_i,j)\right)^n \right) P^{-1}\\
&=P\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}\sum_{n=0}^\infty a_n\left(J(\lambda_i,j)\right)^n P^{-1}\\
&=P\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}f\left(J(\lambda_i,j)\right) \right) P^{-1}
\end{align}
\]

よって\(f(A)\)がどうなるかを調べたかったら各\(f\left(J(\lambda_i,j)\right) \)を調べればよいことがわかります。

いま\( J(0,m)=J_m \)と書くことにすると、\(J_m\)は\(m\)次のべき零行列となっていることと

\( J(\lambda_i,j)=\lambda_i E+J_j\)と分解できることと二項定理から

\[
\begin{align}
&\left( J(\lambda_i,j)\right)^n=\sum_{k=0}^{j-1}\frac{n_k}{k!}{\lambda_i}^{n-k}J_j^k
\: \left(\text{ただし} n_k=\frac{n!}{(n-k)!}\right)
\end{align}
\]

が成り立ちます。
\((4)\)を\( (3) \)に代入して


\[
\begin{align}
&P\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}\sum_{n=0}^\infty a_n\left(J(\lambda_i,j)\right)^n\right)P^{-1} \\
=&P\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}\sum_{n=0}^\infty a_n \left( \sum_{k=0}^{j-1}\frac{n_j}{k!}{\lambda_i}^{n-k}J_j^k\right)\right)P^{-1}\\
=&P\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}\sum_{k=0}^{j-1}\left(\sum_{n=0}^\infty a_n n_j{\lambda_i}^{n-k}\right)\frac{1}{k!}J_j^k\right)P^{-1}
\end{align}
\]

ここで

\[
\begin{align}
\sum_{n=0}^\infty a_n n_j{\lambda_i}^{n-k}=f^{(k)}(\lambda_i)
\end{align}
\]

なので\((9)\)を\((8)\)に代入して

\[
\begin{align}
P\left(\bigoplus_{1\leq i\leq r,1\leq j \leq s_i}\sum_{k=0}^{j-1}f^{(k)}(\lambda_i)\frac{1}{k!}J_j^k\right)P^{-1}
\end{align}
\]

よって、このようにして定義した行列のべき級数は、元の複素べき級数\(f(z)\)の収束半径に依存することが
わかりました。

このようにして定義される関数を行列の正則関数といいます。

行列の指数関数について(メモ)

行列の指数関数を考えます。

それは普通の指数関数のTaylor展開からの類推で定義できて
\[A \in M_n(\mathbb{C})\]
とするとき(\(M_n(\mathbb{C})\)はn次複素正方行列全体の集合)
\[
\exp(A)=\sum_{k=0}^\infty \frac{(A)^k}{k!}
\]

で定義されます。

これがうぇるでぃふぁいんどであるかを確かめたいのですが、

一気にはできないので、ちょっとずつ考えていこうと思います。

始めに行列の直和の記法を導入します。

行列が

\[
A=\begin{pmatrix}
A_1&&&&\large{O}\\
&A_2&&&\\
&&\ddots&&\\
&&&\ddots&\\
\large{O}&&&&A_r\\
\end{pmatrix}
\]

という形になっているとき(ブロック対角型)であるとき
\[
\begin{align}
A&=A_1\oplus A_2\oplus\cdots\oplus A_r\\
&= \bigoplus_{i=1}^{r}A_i
\end{align}
\]

と書くことにします。

さて線形代数の結果から、任意のn次複素正方行列\(A\)に対して

\[
\begin{align}
P^{-1}AP=\nonumber &J(\lambda_1,k_{11})\oplus J(\lambda_1,k_{12})\oplus \cdots \oplus J(\lambda_1,k_{1s_1})\\
\nonumber &J(\lambda_2,k_{21})\oplus J(\lambda_1,k_{22})\oplus \cdots \oplus J(\lambda_2,k_{2s_1})\\
\nonumber &\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\\
&J(\lambda_r,k_{r1})\oplus J(\lambda_r,k_{r2})\oplus \cdots \oplus J(\lambda_2,k_{rs_1})\\
\nonumber\\
=&\bigoplus_{1\le i\le r,1\le j\le s_i}J(\lambda_i,k_{ij})
\end{align}
\]

となる正則行列\(P\)が存在します。各\(J(\lambda_i,j)\)は

\[
J(\lambda_i,j)=
\overbrace{
\begin{pmatrix}
\lambda_i&1&0&\cdots&&&0\\
0&\lambda_i&1&0&\cdots&&0\\
&&\ddots&&&&\\
&&&\ddots&&&\\
&&&&\ddots&&\\
0&\cdots&\cdots&\cdots&\cdots&\lambda_i&1\\
0&\cdots&\cdots&\cdots&\cdots&0&\lambda_i
\end{pmatrix}}^{j}\:\text{(\(j\)次正方行列)}
\]

という形の行列です。

このとき

\[
\begin{align}
P^{-1}A^kP=&\left(P^{-1}AP\right)^k\\
=&\left(\bigoplus_{1\le i\le r,1\le j\le s_i}J(\lambda_i,k_{ij})\right)^k\\
=&\bigoplus_{1\le i\le r,1\le j\le s_i}\left(J(\lambda_i,k_{ij})\right)^k
\end{align}
\]

が成り立ちます。

よって、行列の指数関数はジョルダン標準形を用いて書くことができて、

\[
\begin{align}
\exp(A)&=\sum_{k=0}^\infty \frac{(A)^k}{k!}\\
&=\sum_{k=0}^\infty \left(\displaystyle\bigoplus_{1\le i\le r,1\le j\le s_i}\frac{\left(J(\lambda_i,k_{ij})\right)^k}{k!}\right)\\
&=\displaystyle\bigoplus_{1\le i\le r,1\le j\le s_i}\left(\sum_{k=0}^{\infty}\frac{\left(J(\lambda_i,k_{ij})\right)^k}{k!}\right)\\
&=\displaystyle\bigoplus_{1\le i\le r,1\le j\le s_i}\exp(J(\lambda_i,j))
\end{align}
\]

となります。

よって行列指数関数の性質を調べるには、各ジョルダンブロックの行列指数関数について調べればよいことになります。

つづきはまた

2×2行列であそぶ(構成しよう)

行列がなくなってしまった!

行列が高校数学の指導要領からはずれてしまいましたね。

行列は大学に入ったら必ず使うし、とっても役に立つと思うんですが。

代わりに複素平面に関する内容がもう少し増えるみたいです。

不思議な行列

次のような{2\times 2}行列を考えます。

\begin{pmatrix} a&-b \\b&a \end{pmatrix}\qquad a,b\in\mathbb{R}

さて、この行列にはどのような性質があるでしょうか。

まず試みにa=1,b=0とした場合を考えてみましょう。

つまりこれはこのような行列です。

\begin{pmatrix} 1&0 \\0&1 \end{pmatrix}

ご覧のとおり二次の単位行列となります。

ここで、この行列をEと置いておきましょう。

どのような行列Aに対しても

EA=AE=A

が成り立ちます。

積の演算に関してこのような性質を満たすような元を単位元といいます。

なのでEは行列の積の演算における単位元となります。

実際、\begin{pmatrix} a&-b \\b&a \end{pmatrix} (a,b\in\mathbb{R})に対して

 \begin{eqnarray} 
                       \begin{pmatrix} a&-b \\b&a \end{pmatrix}\begin{pmatrix}1&0\\0&1\end{pmatrix}
                     &=&\begin{pmatrix} a\times 1+b\times 0&a\times 0+(-b)\times1 \\ b\times 1+a\times 0&a\times 0+b\times 1 \end{pmatrix}\\
&=& \begin{pmatrix} a&-b \\b&a \end{pmatrix}
    \end{eqnarray}

 \begin{eqnarray} 
                      \begin{pmatrix}1&0\\0&1\end{pmatrix} \begin{pmatrix} a&-b \\b&a \end{pmatrix}
                     &=&\begin{pmatrix} 1\times a+0\times (-b)&1\times (-b)+0\times a \\ 0\times a+1\times b&0\times (-b)+1\times a \end{pmatrix}\\
&=& \begin{pmatrix} a&-b \\b&a \end{pmatrix}
      \end{eqnarray}

となっているので、その性質が成り立っていることがわかります。


では今度は逆にa=0,b=1としてみましょう。

これは次のような行列です。

\begin{pmatrix} 0&-1 \\1&0 \end{pmatrix}

この行列の二乗を考えるととても面白い性質が観察できます。

実際にやってみましょう。

 \begin{eqnarray} 
                      \begin{pmatrix}0&-1\\1&0\end{pmatrix} \begin{pmatrix} 0&-1 \\1&0 \end{pmatrix}
                     &=&\begin{pmatrix} 0\times 0+(-1)\times 1&0\times (-1)+(-1)\times 0 \\ 1\times 0+0\times 1&1\times (-1)+0\times 0 \end{pmatrix}\\
&=&\begin{pmatrix}-1&0\\0&-1\end{pmatrix}\\
&=&-E
\end{eqnarray}

いまI=\begin{pmatrix}0&-1\\1&0\end{pmatrix}とおけば、

I^2=-E


が成り立っています。

つまりIを二乗すると行列の積の単位元E-1倍になるのです。

さらに、E,Iを使うと、任意のA=\begin{pmatrix} a&-b \\b&a \end{pmatrix} (a,b\in\mathbb{R})に対して

次のような分解を考えることができます。

 \begin{eqnarray} 
                       A=\begin{pmatrix} a&-b \\b&a \end{pmatrix}&=&
\begin{pmatrix} a&0 \\0&a \end{pmatrix}+\begin{pmatrix} 0&-b \\b&0 \end{pmatrix}\\&=&
a \begin{pmatrix} 1&0 \\0&1 \end{pmatrix}+b \begin{pmatrix} 0&-1 \\1&0 \end{pmatrix}\\&=&aE+bI
      \end{eqnarray}

この分解を利用してA=\begin{pmatrix} a&-b \\b&a \end{pmatrix},B=\begin{pmatrix} c&-d \\d&c \end{pmatrix} (a,b,c,d\in\mathbb{R})の積を考えると


\begin{eqnarray}
AB=\begin{pmatrix} a&-b \\b&a \end{pmatrix}\begin{pmatrix} c&-d \\d&c \end{pmatrix}
&=&(aE+bI)(cE+dI)\\
&=&acE^2+adEI+bcIE+bdI^2\\
&=&acE+adI+bcI+bd(-E)(\because I^2=-E)\\
&=&(ac-bd)E+(ad+bc)I
\end{eqnarray}

お気づきの方もいると思いますがこの行列は複素数と性質がとてもよく似ています。

複素数を構成する

つまり、次のような対応があるということです。

\begin{eqnarray}
\\
E &\longleftrightarrow& 1\\
\\
I &\longleftrightarrow& i\\
\\
A &\longleftrightarrow& a+bi
\\
\end{eqnarray}

以上の議論から複素数の定義を行列によって行うことができるということがわかります。


そうすればi^2=-1という一見受け入れがたい定義が高校生を

苦しめることなく、複素数により親しめるようになるかもしれません。

それにしても行列はとても面白いのに指導要領からなくなってしまったのはとても惜しいことです。