永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:么正映射與么正矩陣

這份筆記是關於么正映射的定義與性質。

這裡的行與列依循的是台灣的翻譯習慣,即行對應到英文的Column,而列對應到英文的Row。

么正映射

定義 1:么正映射 (Unitary Transformation)

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\)。若對於所有\(x\in V\)都有\(\|T(x)\|=\|x\|\),則稱\(T\)是么正映射(或稱為保長映射(Norm-Preserving Transformation))。

定義 1-1:正交映射 (Orthogonal Transformation)

給定\(F=\mathbb{R}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\)。若對於所有\(x\in V\)都有\(\|T(x)\|=\|x\|\),則稱\(T\)是正交映射(或稱為保長映射(Norm-Preserving Transformation))。

引理 2

給定\(F\)上的有限維內積空間\(V\)與自伴隨的線性映射\(U:V\to V\)。若對於所有\(x\in V\)\(\langle x,U(x)\rangle=0\),則\(U\)為零映射(記作\(T_0\))。

證明:由於\(U\)是自伴隨的,故由這裡的定理10可知存在由\(U\)的特徵向量構成的\(V\)的正交規範基底\(\beta\)。今給定\(0\neq x\in\beta\),則應有\(\lambda\neq 0\)使得\(U(x)=\lambda x\)。則 \[ 0=\langle x,U(x)\rangle=\langle x,\lambda x\rangle=\overline{\lambda}\langle x,x\rangle \]\(\lambda=0\),即\(U(x)=0\), \(\forall x\in\beta\) i.e. \(U=T_0\)QED

定理 3

給定\(F\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),其中\(\dim V=n\),則以下五個敘述等價:
1. \(TT^\ast=T^\ast T=I\)
2. \(\forall x,y\in V\), \(\langle T(x),T(y)\rangle=\langle x,y\rangle\)
3. 若\(\beta\)\(V\)的正交規範基底,則\(T(\beta)\)也是\(V\)的正交規範基底。
4. 存在\(V\)的正交規範基底\(\beta\)使得\(T(\beta)\)也是\(V\)的正交規範基底。
5. \(\forall x\in V\), \(\|T(x)\|=\|x\|\)

證明:我們分成五個部分說明。
1. \(\Rightarrow\) 2.:若\(T^\ast T=I\),則對於所有\(x,y\in V\),有 \[ \langle x,y\rangle=\langle\underbrace{T^\ast T}_{=I}(x),y\rangle=\langle T(x),T(y)\rangle \]
2. \(\Rightarrow\) 3.:若2.成立,則令\(\beta=\{v_1,v_2,\cdots,v_n\}\)\(V\)的正交規範基底。考慮\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)。則 \[ \langle T(v_i),T(v_j)\rangle=\langle v_i,v_j\rangle=\delta_{ij} \]\(T(\beta)\)也是正交規範的,且由這裡的註記9-2知\(T(\beta)\)也是\(V\)的基底。
3. \(\Rightarrow\) 4.:這是顯然的。
4. \(\Rightarrow\) 5.:若4.成立,則令\(\beta=\{v_1,v_2,\cdots,v_n\}\)\(V\)的正交規範基底,且\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)也是正交規範基底。對於\(x\in V\),我們可以令 \[ x=\sum_{i=1}^n a_iv_i \]\[ \begin{aligned} \|x\|^2&=\left\langle\sum_{j=1}^n a_jv_j,\sum_{i=1}^n a_iv_i\right\rangle\\ &=\sum_{i,j}\overline{a_i}a_j\langle v_i,v_j\rangle\\ &=\sum_{i=1}^n|a_i|^2 \end{aligned} \] 再考慮 \[ T(x)=\sum_{i=1}^n a_iT(v_i) \] 則由於\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)也是正交規範基底,故重複上面的操作會得到 \[ \|T(x)\|^2=\sum_{i=1}^n|a_i|^2 \] 即有\(\|T(x)\|=\|x\|\)
5. \(\Rightarrow\) 1.:若5.成立,則對於所有\(x\in V\),有 \[ \langle x,x\rangle=\|x\|^2=\|T(x)\|^2=\langle T(x),T(x)\rangle=\langle x,T^\ast T(x)\rangle=\langle T^\ast T(x),x\rangle \] 故對於所有\(x\in V\),有 \[ \langle x,(I-T^\ast T)(x)\rangle=0=\langle (I-T^\ast T)(x),x\rangle \]\(I-T^\ast T\)是自伴隨的。由引理2可知\(I-T^\ast T=0\),即\(T^\ast T=I\) i.e. \(T^\ast=T^{-1}\)QED

註記 3-1

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),則以下兩個敘述等價:
1. 存在某個由\(T\)的特徵向量構成的\(V\)的正交規範基底,其中這些特徵向量對應到的特徵值的絕對值都是\(1\)
2. \(T\)是正規且么正的。

證明:我們分成兩部分說明。
1. \(\Rightarrow\) 2.:今已知\(V\)有正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)使得\(T(v_i)=\lambda_iv_i\)\(|\lambda_i|=1\)。則由這裡的定理7知\(T\)是正規的。故對於所有\(v_i\in\beta\),有 \[ T^\ast T(v_i)=\lambda_i\overline{\lambda_i}v_i=|\lambda_i|^2v_i=v_i \]\(T^\ast T=TT^\ast=I\),即\(T\)是么正的(定理3第1.點)。
2. \(\Rightarrow\) 1.:若\(T\)是正規且么正的,則由這裡的定理7知存在\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdot,v_n\}\)使得\(T(v_i)=\lambda_iv_i\), \(\forall i=1\sim n\)。而由\(T\)是么正的可知 \[ \|T(v_i)\|=\|v_i\|=\|\lambda_iv_i\|=|\lambda_i|\|v_i\| \]\(|\lambda_i|=1\)QED

註記 3-2

給定\(F=\mathbb{R}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),則以下兩個敘述等價:
1. 存在某個由\(T\)的特徵向量構成的\(V\)的正交規範基底,其中這些特徵向量對應到的特徵值的絕對值都是\(1\)
2. \(T\)是自伴隨且正交的。

證明:我們分成兩部分說明。
1. \(\Rightarrow\) 2.:今已知\(V\)有正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)使得\(T(v_i)=\lambda_iv_i\)\(|\lambda_i|=1\)。則由這裡的定理10知\(T\)是自伴隨的。故對於所有\(v_i\in\beta\),有 \[ T^\ast T(v_i)=\lambda_i^2v_i=|\lambda_i|^2v_i=v_i \]\(T^\ast T=TT^\ast=I\),即\(T\)是正交的(定理3第1.點)。
2. \(\Rightarrow\) 1.:若\(T\)是自伴隨且正交的,則由這裡的定理10知存在\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdot,v_n\}\)使得\(T(v_i)=\lambda_iv_i\), \(\forall i=1\sim n\)。而由\(T\)是正交的可知 \[ \|T(v_i)\|=\|v_i\|=\|\lambda_iv_i\|=|\lambda_i|\|v_i\| \]\(|\lambda_i|=1\)QED

例 3-2-1:鏡射 (Reflection)

考慮\(\mathbb{R}^2\)中的一維子空間\(L\),並考慮其正交補餘\(L^\perp\)(見這裡的定義1),則考慮如下的線性映射\(T\): \[ T(x)=\left\{ \begin{aligned} x&,\mbox{ if }x\in L\\ -x&,\mbox{ if }x\in L^\perp \end{aligned} \right. \] 顯然\(T\)的特徵值只有\(\pm 1\),故由註記3-2知\(T\)是自伴隨且正交的。這樣的\(T\)稱為\(\mathbb{R}^2\)中關於\(L\)的鏡射。

么正矩陣

定義 4:么正矩陣 (Unitary Matrix)

給定矩陣\(A\in M_{n\times n}(\mathbb{C})\),若\(A^\ast A=AA^\ast=I\),則稱\(A\)是么正矩陣。

定義 4-1:正交矩陣 (Orthogonal Matrix)

給定矩陣\(A\in M_{n\times n}(\mathbb{R})\),若\(A^t A=AA^t=I\),則稱\(A\)是正交矩陣。

註記 4-2

給定矩陣\(A\in M_{n\times n}(F)\),則\(AA^\ast=I\) iff. \(A\)的各列(或各行)構成\(\mathbb{F}^n\)的正交規範基底。

證明:我們有 \[ \delta_{ij}=I_{ij}=(AA^\ast)_{ij}=\sum_{k=1}^n A_{ik}A^\ast_{kj} \] 而這是\(A\)的第\(i\)列和第\(j\)列的內積,故可知\(A\)的各列是正交規範的。而由這裡的註記9-2可知\(A\)的各列構成\(V\)的正交規範基底。QED

註記 4-3

給定正規矩陣\(A\in M_{n\times n}(\mathbb{C})\)(即\(AA^\ast=A^\ast A\)),則由這裡的定理7知存在由\(A\)的特徵向量構成的\(\mathbb{C}^n\)的正交規範基底。
類似的,給定對稱矩陣\(A\in M_{n\times n}(\mathbb{R})\)(即\(A=A^t\)),則由這裡的定理10知存在由\(A\)的特徵向量構成的\(\mathbb{R}^n\)的正交規範基底。

定義 5:么正等價 (Unitarily Equivalent)

給定矩陣\(A,D\in M_{n\times n}(\mathbb{C})\),若存在么正矩陣\(Q\)使得\(D=Q^\ast AQ\),則稱\(A\)\(D\)么正等價。

定義 5-1:正交等價 (Orthogonally Equivalent)

給定矩陣\(A,D\in M_{n\times n}(\mathbb{R})\),若存在正交矩陣\(Q\)使得\(D=Q^t AQ\),則稱\(A\)\(D\)正交等價。

定理 6

給定矩陣\(A\in M_{n\times n}(\mathbb{C})\),則\(A\)是正規的 iff. \(A\)么正等價於某個對角矩陣。
類似的,給定矩陣\(A\in M_{n\times n}(\mathbb{R})\),則\(A\)是自伴隨的 iff. \(A\)正交等價於某個對角矩陣。

證明:兩種狀況的說明是類似的,這裡只說明\(F=\mathbb{C}\)的狀況。我們分成兩部分說明。
\(\Rightarrow\)」:若\(A\)是正規的,則由註記4-3知存在由\(A\)的特徵向量構成的\(\mathbb{C}^n\)的正交規範基底\(\beta\)。令\(\gamma\)\(\mathbb{C}^n\)的標準基底,並令\(Q\)為座標轉換矩陣\(Q=[I]^\gamma_\beta\)。由註記4-2知\(Q\)應是么正的,即\(Q^\ast=Q^{-1}\)。則由這裡的定理3知 \[ [A]_\beta=Q^{-1}[A]_\gamma Q=Q^\ast AQ \] 而由定義知\([A]_\beta\)應是對角矩陣,即\([A]_\gamma=A\)么正等價於某個對角矩陣。
\(\Leftarrow\)」:若\(A\)么正等價於某個對角矩陣\(D\) i.e. 存在么正矩陣\(Q\)使得\(A=Q^\ast DQ\),其中\(Q^\ast=Q^{-1}\)。則 \[ \begin{aligned} A^\ast A&=(Q^\ast DQ)^\ast (Q^\ast DQ)\\ &=(Q^\ast D^\ast Q)(Q^\ast DQ)\\ &=(Q^\ast D^\ast)(QQ^\ast)(DQ)\\ &=Q^\ast(D^\ast D)Q\\ &=Q^\ast(DD^\ast)Q\;(D\mbox{是對角矩陣})\\ &=(Q^\ast DQ)(Q^\ast D^\ast Q)=AA^\ast \end{aligned} \]\(A\)是正規的。QED

註記 7

給定\(F\)上的有限維內積空間\(V\)與自伴隨映射\(T:V\to V\),其中\(\dim V=n\)。並給定\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\),令\(A=[T]_\beta\)。則\(T\)是半正定的 iff. 存在某個矩陣\(B\)使得\(A=B^\ast B\)(半正定的定義見這裡的定義12)。

證明:我們分兩個部分說明。
\(\Rightarrow\)」:由於\(T\)是自伴隨的,故由定理6知存在么正矩陣\(P\)與對角矩陣\(D\)使得\(A=P^\ast DP\),其中\(D\)的對角線元素為\(T\)的特徵值。由這裡的註記13知可以令 \[ D=\left( \begin{array}{ccc} \lambda_1 & & \\ & \ddots & \\ & & \lambda_n \end{array} \right),\lambda_i\geq 0 \] 於是,我們可以令 \[ E=\left( \begin{array}{ccc} \sqrt{\lambda_1} & & \\ & \ddots & \\ & & \sqrt{\lambda_n} \end{array} \right) \] 於是便有 \[ A=P^\ast DP=(P^\ast E)(EP) \]\(B=EP\)即得所求。
\(\Leftarrow\)」:若存在\(B\)使得\(A=B^\ast B\),則 \[ A=B^\ast B=B^\ast B^{\ast\ast}=(B^\ast B)^\ast=A^\ast \] 故知\(A\)是自伴隨的。而給定\(y\in V\),可以令 \[ [y]_\beta=\left( \begin{array}{c} a_1\\ \vdots\\ a_n \end{array} \right)\in F^n \] 則由這裡的註記14知 \[ (\overline{a_1},\cdots,\overline{a_n})(B^\ast B)\left( \begin{array}{c} a_1\\ \vdots\\ a_n \end{array} \right)=\langle T(y),y\rangle \]\[ \begin{aligned} (\overline{a_1},\cdots,\overline{a_n})(B^\ast B)\left( \begin{array}{c} a_1\\ \vdots\\ a_n \end{array} \right)&=\sum_{i,j}\overline{a_i}(B^\ast B)_{ij}a_j\\ &=\sum_{i,j,k}\overline{a_i}B_{ik}^\ast B_{kj}a_j\\ &=\sum_k\left(\sum_i \overline{B_{ki}a_i}\right)\left(\sum_j B_{kj}a_j\right)\\ &=\sum_{i,j,k,m}(B_{kj}a_j)(\overline{B_{mi}a_i})\langle v_k,v_m\rangle\\ &(\langle v_k,v_m\rangle=\delta_{km})\\ &=\left\langle\sum_j\sum_kB_{kj}a_jv_k,\sum_i\sum_mB_{mi}a_iv_m\right\rangle\\ &=\langle By,By\rangle=\|By\|^2\geq 0 \end{aligned} \] 故可知\(T\)是半正定的。QED

註記 8:舒爾定理 (Schur's Theorem)

給定\(B\in M_{n\times n}(F)\),其中\(B\)的特徵多項式在\(F\)上分裂,則:
1. 若\(F=\mathbb{C}\),則\(B\)和某個上三角矩陣么正等價。
2. 若\(F=\mathbb{R}\),則\(B\)和某個上三角矩陣正交等價。
(這是這裡的定理4根據定理6的證明過程所做的改寫。)