一般化逆行列についての雑記

始めに

とある資格の勉強中に一般化逆行列の性質についての問題があったので気になって調べてみた。

ggってみると幾つかヒットしたので読んでみた。大まかに理解するのに下記のページが比較的分かり易かった。

ただし、色々調べてみると一般化逆行列の表記が$[A^-]$と$[A^+]$に分かれていることに気づいた。また、ラグランジュの未定乗数法を用いて計算を行う際に若干違和感を抱いてしまった。

行列の表記の違いについて

まず$[A^-]$と$[A^+]$の表記の違いについて調べた。

文献を漁ってみたところ、下記の文献では一般化逆行列を$[A^-]$、ムーアペンローズ一般逆行列を$[A^+]$と表していた。

また、日本機械学会の運営する公式サイトではムーアペンローズ一般逆行列を$[A^+]$として表現している。その他、下記の記事でも一般化逆行列とムーアペンローズ一般逆行列の表記を$[A^-]$と$[A^+]$で分けている。

一方、線形代数の参考書として有名な下記の書籍では、一貫して一般逆行列に$[A^-]$を使っており、特に使い分けている感じは無い1

やはり一般逆行列とムーアペンローズ一般逆行列を明確に分けるための表現のようだが、そこまで厳密には決まってないのかもしれない。

ラグランジュの未定乗数法を用いた計算

未知数$m$が行列$[A]$のランク$r$以上の場合($m\geq r$)、ラグランジュ関数を定めて$\{x\}$が最小となるときの$\{\lambda\}$を探すのだが、ここで$\{x\}^T\{x\}$に$1/2$がかかっているのが(初めて見た時は)理解できなかった。

\begin{equation} L = \frac{1}{2}\{x\}^T\{x\} - \{\lambda\}^T ([A]\{x\}-\{b\}) \end{equation}

何も知らない状態でラグランジュの未定乗数法を用いると、単に$\{x\}^T\{x\}$が最小となる候補を探す計算になるはずなので、$\{x\}^T\{x\}$に$1/2$が掛からない次のような形になるのでは…?と思った。

\begin{equation} L = \{x\}^T\{x\} - \{\lambda\}^T ([A]\{x\}-\{b\}) \end{equation}

このまま計算すると、

\begin{equation} \frac{\partial L}{\partial\{x\}}=2\{x\} - \{\lambda\}^T[A]=0 \end{equation}

\begin{equation} \therefore \{x\} = \frac{1}{2}\{\lambda\}^T[A] \end{equation}

となるが、結局$\{\lambda\}$は任意の実数を含むベクトルなので、$1/2\{\lambda\} = \{\lambda’\}$とおけば、

\begin{equation} \{x\} = \{\lambda’\}^T[A] \end{equation}

となり、$\{\lambda\}$が$\{\lambda’\}$に変わるだけである。

一応、この$\{\lambda’\}$を使って一般化逆行列を表す次の式が求まるか確かめる。

\begin{equation} [A^-] = A^T([A][A]^T)^{-1} \end{equation}

一般に、ラグランジュの未定乗数法では$g(x, y)=0$のときに$f(x, y)$が極値を取る条件を探すために次のラグランジュ関数を考える。

\begin{equation} L = f(x, y) - \lambda g(x, y) \end{equation}

したがって今回だと、

\begin{equation} f = \frac{1}{2}\{x\}^T\{x\}, {\quad} \{g\} = [A]\{x\} - \{b\} \end{equation}

と考えればよい。そして$\{g\}$についての条件から、

\begin{equation} [A]\{x\} - \{b\} = \{0\} \end{equation}

となる。式(9)と式(5)より、

\begin{eqnarray} \{b\} &=& [A][A]^T\{\lambda’\} \nonumber\\ \therefore \{\lambda’\} &=& ([A][A]^T)^{-1}\{b\} \\ \end{eqnarray}

となる。これを式(4)に戻せば、

\begin{eqnarray} \{x\} &=& [A]^T\{\lambda’\} \nonumber\\ &=& [A]^T([A][A]^T)^{-1}\{b\} \nonumber\\ &=& [A^-]\{b\} \end{eqnarray}

となり、式(6)と同じとなる。このように、結局のところ$1/2$が$\{x\}^T\{x\}$に掛かってようがなかろうが、同じ一般化逆行列を求めることができる。

ただし、今回の様に途中で$\{\lambda’\}$のような新しい変数を導入するよりも、始めから式(1)のラグランジュ関数を定義した方が計算が簡素になるので好ましい。

最後に

独学していると、こういう痒い所を掻いてくれる解説があると非常にありがたく感じる(自画自賛)。


  1. それなりに読み込んでいますが、読み落としている部分があるかもしれませんので悪しからず。 ↩︎