目次
続きは現在作成中

基本変形と行列の階数

2022-07-08

行列の正則性について

\(n\) 次の正方行列 \(A\) が正則であるとは \[AX=XA=E_n\] となる \(n\) 次の正方行列 \(X\) が存在するという意味でした。

つまり、 \(AX=E_n\) となる \(X\) が存在するだけではダメで、 \(XA=E_n\) も成り立たなくてはならないわけです。

しかし実は次のような定理を証明することができます。

定理

  1. \(n\) 次の正方行列 \(A\) に対して、\(AX=E_n\) となる \(n\) 次の正方行列 \(X\) があれば、\(XA=E_n\) も成り立ちます。
  2. \(n\) 次の正方行列 \(A\) に対して、\(XA=E_n\) となる \(n\) 次の正方行列 \(X\) があれば、\(AX=E_n\) も成り立ちます。

つまり、どっちか成り立てば残りも実は成り立つと主張しているわけです。

この定理は行列式の理論を学ぶとわりと簡単に証明できますが、ここでは行列式の理論を使わない方法で証明しておきます。

証明

1.の証明

\(n\) に関する帰納法で証明することにしましょう。

\(n=1\) の時は、行列と言ってもただの数なので、あきらかに成り立ちます。 \(n =k\) の時に成り立つと仮定します。そしてこの仮定を認めると \(n=k+1\) のときにも成り立ってしまうということをこれから示せば良いわけです。

いま、\(k+1\) 次の 正方行列 \(A\) には \(AX=E_{k+1}\) となる \(k+1\) 次の正方行列 \(X\) があるので、もちろん \(A\) は零行列ではありません。 ですから、\(A\)\(0\) ではない成分をもちます。そこで、\(A\) に対して行の入れ替えや列の入れ替え、行をナントカ倍にしたり列をナントカ倍する基本変形をうまく組合せて実行すると、 \((1,1)\) 成分を \(1\) にすることができます。

さらに、その \(1\) を使い各行に1行目のナントカ倍を足したり各列に1列目のナントカ倍を足すという基本変形をすることにより、1行目と 1列目では \((1,1)\) 成分以外すべて \(0\) にすることができます。(つまり、\((1,1)\) 成分の \(1\) を使って掃き出すことができます。)

行に関する基本変形は左からある正則行列を掛けることで実現でき、列に関する基本変形はある正則行列を右から掛けることで実現できます。ですから、ここまでの話は、何かしらの行変形の基本行列 \(P_1,P_2,\ldots,P_s\) と列変形の基本行列 \(Q_1,Q_2,\ldots,Q_t\) があって、

\[P_sP_{s-1}\cdots P_1AQ_1Q_2\cdots Q_t =\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right)\]

とできるということを意味しています。ここで、\(A_k\) は基本変形の結果出現する何かしらの \(k\) 次の正方行列です。
計算を見やすくするために、

\[ \begin{align} &P=P_sP_{s-1}\cdots P_1\\[6pt] &Q=Q_1Q_2\cdots Q_t\\[6pt] &PAQ=\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right) \end{align} \]

とおくことにします。基本行列 \(P_i\) たちや \(Q_i\) たちは正則なので \(P,Q\) も正則です。

\(A\) には \(AX=E_{k+1}\) となる \(k+1\) 次の正方行列 \(X\) があります。この条件について、\(A\) に基本変形をおこなってあらわれた \(PAQ\) を使って議論したいと思います。そこで、\(X\) の代わりに \[Q^{-1}XP^{-1}\] を使うことにします。なぜなら、 \[AX=E_{k+1}\] が成り立っていることと \[(PAQ)(Q^{-1}XP^{-1})=E_{k+1}\] が成り立っていることとは同じことだからです。

\(Q^{-1}XP^{-1}\)\(PAQ\) の区分けに対応させて \[Q^{-1}XP^{-1}=\left(\begin{array}{cc} u & {}^t \!\,\boldsymbol{v}\\ \boldsymbol{w} & Y_k \end{array}\right)\] のように区分けして考えることにし、\(u,\boldsymbol{v},\boldsymbol{w},Y_k\) がどのような条件を満たさなくてはならないのか調べてみることにします。

\[\begin{align} (PAQ)(Q^{-1}XP^{-1})&=\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right)\left(\begin{array}{cc} u & {}^t \!\,\boldsymbol{v}\\ \boldsymbol{w} & Y_k \end{array}\right)\\ &=\left(\begin{array}{cc} u & {}^t \!\,\boldsymbol{v}\\ A_{k}\boldsymbol{w} & A_kY_k \end{array}\right)\\ \end{align}\]

となりますが、これは \(E_{k+1}\) に等しいはずです。ですから、

\[\begin{align} &u=1 \tag{1}\\ &\boldsymbol{v}=\boldsymbol{0} \tag{2}\\ & A_{k}\boldsymbol{w}=\boldsymbol{0} \tag{3}\\ & A_kY_k=E_k \tag{4} \end{align}\]

が成り立つことがわかりました。

ところで、\(A_k\)\(k\) 次の正方行列です。そして \(k\) 次の正方行列についてはこの定理の主張が正しいことを帰納法の仮定として認めることにしてあるのでした。ですから、(4) より \[Y_kA_k=E_k \tag{5}\] が成り立ちます。(というわけで、\(Y_k\)\(A_k\) の逆行列ということになります。)

ですからさらに、 (3) の両辺に左から \(Y_k\) をかければ (5) より、 \[\boldsymbol{w}=\boldsymbol{0}\] であることがわかります。これで、 \[Q^{-1}XP^{-1} =\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & Y_k \end{array}\right)\] であることがわかりました。

以上のことを確認した上で \(PAQ\)\(Q^{-1}XP^{-1}\) から \(A\)\(X\) に戻って議論を進めることにします。つまり、

\[ \begin{align} & A=P^{-1}\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right)Q^{-1},\\ & X=Q \left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & Y_k \end{array}\right) P \end{align}\]

のように \(A\)\(X\) に戻して考えます。そして \(XA=E_{k+1}\) が成り立ってしまうことを確認すれば証明が終わるわけです。

\(Y_kA_k=E_k\) であることを頭に入れて \(XA\) がどのような行列になるのか計算してみましょう。すると、

\[\begin{align} XA&=\left\{Q \left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & Y_k \end{array}\right) P\right\} \left\{P^{-1}\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right)Q^{-1}\right\}\\[6pt] &=Q\left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & Y_k \end{array}\right) \left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & A_k \end{array}\right) Q^{-1}\\[6pt] &=Q \left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & Y_kA_k \end{array}\right) Q^{-1}\\[6pt] &=Q \left(\begin{array}{cc} 1 & {}^t \!\,\boldsymbol{0}\\ \boldsymbol{0} & E_k \end{array}\right) Q^{-1}\\[6pt] &=E_{k+1} \end{align}\]

が成り立つことがわかります。これで証明ができました。

2.の証明

この場合も1.と同様に証明できるのはほぼ明らかでしょう。

(証明終わり)

行列の階数

どんな \((m,n)\) 型の行列も行と列に関する基本変形をうまく使えば、標準形と呼ばれる、

\[ \left( \begin{array}{cccc|cccc} 1 & 0 & \cdots & 0 & 0 & \cdots & \cdots & 0\\ 0 & 1 & \ddots & 0 & 0 & \cdots & \cdots & 0\\ \vdots & \ddots & \ddots & & \vdots & & & \vdots \\ 0 & 0 & & 1 & 0 & \cdots & \cdots & 0\\ \hline 0 & 0 & \cdots & 0 & 0 &\cdots & \cdots & 0\\ \vdots & \vdots & & \vdots &\vdots & & &\vdots \\ 0 & 0 &\cdots & 0 & 0 & \cdots & \cdots & 0 \end{array}\right) \]

という形に変形することができるのでした。

補足:ここでは形を理解しやすくするために縦線と横線を書き入れてあります。零行列も標準形に含まれ、縦線より右側がないもの、横線より下側がないものも標準形に含まれます。

ところで、基本変形を使って標準形にしていく道筋は人によって違うことでしょう。そこで次のような疑問が浮かびます。

疑問
基本変形をうまく使って標準形に変形すると、\(1\) が左上から右斜め下へ向かっていくつか並びますが、誰がどのように基本変形をしてもその個数は同じになるのでしょうか?

この疑問に答えるのが次の定理です。

定理

基本変形を使って行列を標準形にしたとき、\(1\) が並ぶ個数は、基本変形の仕方に関係なく必ず同じになります。

証明

\((m,n)\) 型行列 \(A\) にある仕方でいくつかの基本変形を行った結果 \(1\)\(r\) 個並んだ標準形の行列 \(F(r)\) が得られ、別の仕方でいくつかの基本変形をおこなった結果 \(1\)\(s\) 個並んだ標準形の行列 \(F(s)\) が得られたとします。

とりあえずこのとき \(r\)\(s\) の大小関係として \(r \leq s\) となる場合や \(s \leq r\) となる場合が想定出来るわけですが、必要に応じて文字 \(r\) と 文字 \(s\) を入れ換えて考えることにすれば、\(r \leq s\) の場合に限って話を進めることができます。そこで以下 \(r \leq s\) とします。

どの基本変形にも元に戻す基本変形があるので、\(F(r)\) にいくつかの基本変形を行うことにより \(A\) が得られ、それに続いて \(A\) から \(F(s)\) を得る基本変形を行えば、\(F(r)\) から \(F(s)\) が得られるはずです。つまり、ある正則行列 \(P\)\(Q\) が存在して、 \[F(s) = PF(r)Q \tag{6}\] が成り立っているわけです。というわけでこれからこの等式を詳しく分析してしてみることにしましょう。そのために、\(F(r)\) に合わせて \(P\)\(Q\) を区分けしてみることにします。 つまり、 \[ \begin{align} &\quad\,\color{green}{\stackrel{r}{\class{rotate90}{\{ }} \,\,\,\,\,\,\,\, \stackrel{n-r}{\class{rotate90}{\{ }}}\\[-10pt] F(r)\,\,\,= \begin{array}{r} \color{green}{\scriptsize{r}\,\, \bigl\{ }\\ \color{green}{\scriptsize{m-r}\,\, \bigl\{ } \end{array}& \left( \begin{array}{c|c} \,E_r\, & \, O\,\\ \hline \,O\, & \, O\, \end{array} \right) \end{align} \] となっているわけですから

\[ \begin{align} &\quad\,\, \color{green}{\stackrel{r}{\class{rotate90}{\{ }} \,\,\,\,\,\,\,\,\,\, \stackrel{m-r}{\class{rotate90}{\{ }}}\\[-10pt] P \,\,\,= \begin{array}{r} \color{green}{\scriptsize{r}\,\, \bigl\{ }\\ \color{green}{\scriptsize{m-r}\,\, \bigl\{ } \end{array}& \left( \begin{array}{c|c} \,P_{11} \, & \, P_{12} \,\\ \hline \,P_{21} \, & \, P_{22} \, \end{array} \right) \ , \end{align} \] \[ \begin{align} &\quad\,\, \color{green}{\stackrel{r}{\class{rotate90}{\{ }} \,\,\,\,\,\,\,\,\,\,\, \stackrel{n-r}{\class{rotate90}{\{ }}}\\[-10pt] Q \,\,\,= \begin{array}{r} \color{green}{\scriptsize{r}\,\, \bigl\{ }\\ \color{green}{\scriptsize{n-r}\,\, \bigl\{ } \end{array}& \left( \begin{array}{c|c} \,Q_{11} \, & \, Q_{12} \,\\ \hline \,Q_{21} \, & \, Q_{22} \, \end{array} \right) \end{align} \] とするわけです。 この区分けを使って (6) の右辺を計算してみると、

\[ \begin{align} PF(r)Q &= \left( \begin{array}{c|c} P_{11} & P_{12}\\ \hline P_{21} & P_{22} \end{array} \right) \left( \begin{array}{c|c} E_r & O\\ \hline O & O \end{array} \right) \left( \begin{array}{c|c} Q_{11} & Q_{12}\\ \hline Q_{21} & Q_{22} \end{array} \right)\\[6pt] &=\left(\begin{array}{c|c} P_{11} & O\\ \hline P_{21} & O \end{array}\right) \left( \begin{array}{c|c} Q_{11} & Q_{12}\\ \hline Q_{21} & Q_{22} \end{array}\right)\\[6pt] & \qquad \qquad \quad \,\color{green}{\overbrace{}^r \qquad \,\overbrace{}^{n-r}}\\[-10pt] &= \begin{array}{r} \color{green}{\scriptsize{r}\,\, \bigl\{ }\\ \color{green}{\scriptsize{m-r}\,\, \bigl\{ } \end{array} \left( \begin{array}{c|c} P_{11}Q_{11} & P_{11}Q_{12}\\ \hline P_{21}Q_{11} & P_{21}Q_{12} \end{array} \right)\tag{7} \end{align} \]

となります。これが

\[ \begin{align} &\quad\,\color{green}{\stackrel{s}{\class{rotate90}{\{ }} \,\,\,\,\,\,\,\, \stackrel{n-s}{\class{rotate90}{\{ }}}\\[-10pt] F(s)\,\,\,= \begin{array}{r} \color{green}{\scriptsize{s}\,\, \bigl\{ }\\ \color{green}{\scriptsize{m-s}\,\, \bigl\{ } \end{array}& \left( \begin{array}{c|c} \,E_s\, & \, O\,\\ \hline \,O\, & \, O\, \end{array} \right)\tag{8} \end{align} \]

に等しいわけですが、\(r\leq s\) であること、つまり \(E_s\) のサイズは \(P_{11}Q_{11}\) のサイズと同じかそれより大きいことに注意して (7) と (8) を見比べると

\[ \begin{align} & P_{11}Q_{11}=E_r \tag{9}\\[6pt] & P_{21}Q_{11}=O \tag{10}\\[6pt] & P_{11}Q_{12}=O \tag{11} \end{align} \]

であることがわかります。
(9) が成り立つので このページの最初に学んだ定理より、\(Q_{11}P_{11} = E_r\) も成り立つことになり、\(P_{11}\)\(Q_{11}\) は正則、つまり逆行列をもっていることがわかります。ですから、(10) と (11) からさらに \[ \begin{align} & P_{21}=O \\[6pt] & Q_{12}=O \end{align} \] であることがわかります。これらからさらに \[P_{21}Q_{12}=O\] であることがわかります。これを頭に入れて (7) と (8) を見比べると、\(r=s\) でなければならないことがわかります。

(証明終わり)

この定理から、行列を基本変形で標準形にしたとき \(1\) が並ぶ個数は変形していく手順には関係せず、行列そのものがもっている特徴を反映する量であると言えることになります。そこで、次のような定義をすることができます。

定義

行列 \(A\) に行および列に関する基本変形をおこなって標準形にしたとき、\(1\) が並ぶ個数を \(A\)階数といい、\(\mathrm{rank}(A)\) という記号であらわします。

補足:ここで説明した方法以外にも行列の階数という概念を定義する方法がいくつかあります。それらの方法は線形代数学の中心的な概念である線形独立、次元、行列式などに密接な関係を持っていて、どの方法で定義してもすべて一致することを別の機会に説明します。

行列の階数は行列の持つ様々な特徴を表している数です。ここでは、その一つとして、正方行列の階数と行列の正則性の関係について次の命題を示しておくことにします。

命題 \(A\)\(n\) 次の正方行列であるとき、次のことが成り立ちます。

  1. \(A\) が正則ならば \(\mathrm{rank}(A) = n\) です。

  2. \(\mathrm{rank}(A) = n\) であるならば \(A\) は正則です。

証明

\(A\) に基本変形をおこなっていき、標準形が得られたとします。つまり、ある正則行列 \(P\)\(Q\) によって、\(PAQ\) が標準形 \(F(r)\) になったとします。つまり、 \[PAQ=F(r)\]となったとします。

  1. いま \(A\) は正則としています。そして \(P\)\(Q\) は正則です。ですから \(PAQ\) は正則です。一方 \(F(r)\) は対角線上に \(1\)\(r\) 個並んでいて、それ以外の成分がすべて \(0\) の行列ですが、このような行列が正則になるのは \(r=n\) のときだけです。つまり \(\mathrm{rank}(A) = n\) のときだけです。
  2. いま、\(\mathrm{rank}(A) = n\) としています。つまり \(A\) の標準形 \(F(r)\)\(1\)\(n\) 個並んでいるので単位行列 \(E_n\) です。\(P\)\(Q\) は正則ですから、逆行列を持ちます。ですから、\(A=P^{-1}F(r)Q^{-1} =P^{-1}E_nQ^{-1}=P^{-1}Q^{-1}\) となり、\(A\) は正則行列 \(P^{-1}\)\(Q^{-1}\) の積に等しいので正則です。

まとめ

正方行列 \(A\) に対して \(AX=E\) となる行列 \(X\) が存在すればその行列 \(X\)\(XA=E\) も満たしています。また、\(XA=E\) となる行列 \(X\) が存在すればその行列 \(X\)\(AX=E\) も満たしています。ですから、\(AX=E\)\(XA=E\) のどちらかを満たしているだけで、\(A\) は正則で \(X\)\(A\) の逆行列であると断言して良いことになります。

行列 \(A\) に行および列に関する基本変形をおこなって標準形にするとき、\(1\) が並ぶ個数は基本変形のしかたに依存しません。そして \(1\) が並ぶ個数を \(A\)階数といいます。

基本変形と逆行列 連立一次方程式と基本変形