這份筆記是關於么正映射的定義與性質。
這裡的行與列依循的是台灣的翻譯習慣,即行對應到英文的Column,而列對應到英文的Row。
么正映射
定義 1:么正映射 (Unitary Transformation)
給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\)。若對於所有\(x\in V\)都有\(\|T(x)\|=\|x\|\),則稱\(T\)是么正映射(或稱為保長映射(Norm-Preserving Transformation))。
定義 1-1:正交映射 (Orthogonal Transformation)
給定\(F=\mathbb{R}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\)。若對於所有\(x\in V\)都有\(\|T(x)\|=\|x\|\),則稱\(T\)是正交映射(或稱為保長映射(Norm-Preserving Transformation))。
引理 2
給定\(F\)上的有限維內積空間\(V\)與自伴隨的線性映射\(U:V\to V\)。若對於所有\(x\in V\)有\(\langle x,U(x)\rangle=0\),則\(U\)為零映射(記作\(T_0\))。
證明:由於\(U\)是自伴隨的,故由這裡的定理10可知存在由\(U\)的特徵向量構成的\(V\)的正交規範基底\(\beta\)。今給定\(0\neq x\in\beta\),則應有\(\lambda\neq 0\)使得\(U(x)=\lambda x\)。則 \[ 0=\langle x,U(x)\rangle=\langle x,\lambda x\rangle=\overline{\lambda}\langle x,x\rangle \] 故\(\lambda=0\),即\(U(x)=0\), \(\forall x\in\beta\) i.e. \(U=T_0\)。QED
定理 3
給定\(F\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),其中\(\dim V=n\),則以下五個敘述等價:
1.
\(TT^\ast=T^\ast T=I\)
2. \(\forall x,y\in V\), \(\langle T(x),T(y)\rangle=\langle
x,y\rangle\)
3. 若\(\beta\)是\(V\)的正交規範基底,則\(T(\beta)\)也是\(V\)的正交規範基底。
4. 存在\(V\)的正交規範基底\(\beta\)使得\(T(\beta)\)也是\(V\)的正交規範基底。
5. \(\forall x\in V\), \(\|T(x)\|=\|x\|\)
證明:我們分成五個部分說明。
1.
\(\Rightarrow\) 2.:若\(T^\ast T=I\),則對於所有\(x,y\in V\),有 \[
\langle x,y\rangle=\langle\underbrace{T^\ast T}_{=I}(x),y\rangle=\langle
T(x),T(y)\rangle
\]
2. \(\Rightarrow\)
3.:若2.成立,則令\(\beta=\{v_1,v_2,\cdots,v_n\}\)為\(V\)的正交規範基底。考慮\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)。則
\[
\langle T(v_i),T(v_j)\rangle=\langle v_i,v_j\rangle=\delta_{ij}
\] 即\(T(\beta)\)也是正交規範的,且由這裡的註記9-2知\(T(\beta)\)也是\(V\)的基底。
3. \(\Rightarrow\) 4.:這是顯然的。
4. \(\Rightarrow\) 5.:若4.成立,則令\(\beta=\{v_1,v_2,\cdots,v_n\}\)為\(V\)的正交規範基底,且\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)也是正交規範基底。對於\(x\in V\),我們可以令 \[
x=\sum_{i=1}^n a_iv_i
\] 則 \[
\begin{aligned}
\|x\|^2&=\left\langle\sum_{j=1}^n a_jv_j,\sum_{i=1}^n
a_iv_i\right\rangle\\
&=\sum_{i,j}\overline{a_i}a_j\langle v_i,v_j\rangle\\
&=\sum_{i=1}^n|a_i|^2
\end{aligned}
\] 再考慮 \[
T(x)=\sum_{i=1}^n a_iT(v_i)
\] 則由於\(T(\beta)=\{T(v_1),T(v_2),\cdots,T(v_n)\}\)也是正交規範基底,故重複上面的操作會得到
\[
\|T(x)\|^2=\sum_{i=1}^n|a_i|^2
\] 即有\(\|T(x)\|=\|x\|\)。
5. \(\Rightarrow\)
1.:若5.成立,則對於所有\(x\in V\),有
\[
\langle x,x\rangle=\|x\|^2=\|T(x)\|^2=\langle T(x),T(x)\rangle=\langle
x,T^\ast T(x)\rangle=\langle T^\ast T(x),x\rangle
\] 故對於所有\(x\in V\),有
\[
\langle x,(I-T^\ast T)(x)\rangle=0=\langle (I-T^\ast T)(x),x\rangle
\] 故\(I-T^\ast
T\)是自伴隨的。由引理2可知\(I-T^\ast
T=0\),即\(T^\ast T=I\) i.e.
\(T^\ast=T^{-1}\)。QED
註記 3-1
給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),則以下兩個敘述等價:
1.
存在某個由\(T\)的特徵向量構成的\(V\)的正交規範基底,其中這些特徵向量對應到的特徵值的絕對值都是\(1\)。
2. \(T\)是正規且么正的。
證明:我們分成兩部分說明。
1.
\(\Rightarrow\) 2.:今已知\(V\)有正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)使得\(T(v_i)=\lambda_iv_i\)且\(|\lambda_i|=1\)。則由這裡的定理7知\(T\)是正規的。故對於所有\(v_i\in\beta\),有 \[
T^\ast T(v_i)=\lambda_i\overline{\lambda_i}v_i=|\lambda_i|^2v_i=v_i
\] 故\(T^\ast
T=TT^\ast=I\),即\(T\)是么正的(定理3第1.點)。
2. \(\Rightarrow\) 1.:若\(T\)是正規且么正的,則由這裡的定理7知存在\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdot,v_n\}\)使得\(T(v_i)=\lambda_iv_i\), \(\forall i=1\sim n\)。而由\(T\)是么正的可知 \[
\|T(v_i)\|=\|v_i\|=\|\lambda_iv_i\|=|\lambda_i|\|v_i\|
\] 即\(|\lambda_i|=1\)。QED
註記 3-2
給定\(F=\mathbb{R}\)上的有限維內積空間\(V\)與線性映射\(T:V\to V\),則以下兩個敘述等價:
1.
存在某個由\(T\)的特徵向量構成的\(V\)的正交規範基底,其中這些特徵向量對應到的特徵值的絕對值都是\(1\)。
2. \(T\)是自伴隨且正交的。
證明:我們分成兩部分說明。
1.
\(\Rightarrow\) 2.:今已知\(V\)有正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)使得\(T(v_i)=\lambda_iv_i\)且\(|\lambda_i|=1\)。則由這裡的定理10知\(T\)是自伴隨的。故對於所有\(v_i\in\beta\),有 \[
T^\ast T(v_i)=\lambda_i^2v_i=|\lambda_i|^2v_i=v_i
\] 故\(T^\ast
T=TT^\ast=I\),即\(T\)是正交的(定理3第1.點)。
2. \(\Rightarrow\) 1.:若\(T\)是自伴隨且正交的,則由這裡的定理10知存在\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdot,v_n\}\)使得\(T(v_i)=\lambda_iv_i\), \(\forall i=1\sim n\)。而由\(T\)是正交的可知 \[
\|T(v_i)\|=\|v_i\|=\|\lambda_iv_i\|=|\lambda_i|\|v_i\|
\] 即\(|\lambda_i|=1\)。QED
例 3-2-1:鏡射 (Reflection)
考慮\(\mathbb{R}^2\)中的一維子空間\(L\),並考慮其正交補餘\(L^\perp\)(見這裡的定義1),則考慮如下的線性映射\(T\): \[ T(x)=\left\{ \begin{aligned} x&,\mbox{ if }x\in L\\ -x&,\mbox{ if }x\in L^\perp \end{aligned} \right. \] 顯然\(T\)的特徵值只有\(\pm 1\),故由註記3-2知\(T\)是自伴隨且正交的。這樣的\(T\)稱為\(\mathbb{R}^2\)中關於\(L\)的鏡射。
么正矩陣
定義 4:么正矩陣 (Unitary Matrix)
給定矩陣\(A\in M_{n\times n}(\mathbb{C})\),若\(A^\ast A=AA^\ast=I\),則稱\(A\)是么正矩陣。
定義 4-1:正交矩陣 (Orthogonal Matrix)
給定矩陣\(A\in M_{n\times n}(\mathbb{R})\),若\(A^t A=AA^t=I\),則稱\(A\)是正交矩陣。
註記 4-2
給定矩陣\(A\in M_{n\times
n}(F)\),則\(AA^\ast=I\) iff.
\(A\)的各列(或各行)構成\(\mathbb{F}^n\)的正交規範基底。
證明:我們有 \[ \delta_{ij}=I_{ij}=(AA^\ast)_{ij}=\sum_{k=1}^n A_{ik}A^\ast_{kj} \] 而這是\(A\)的第\(i\)列和第\(j\)列的內積,故可知\(A\)的各列是正交規範的。而由這裡的註記9-2可知\(A\)的各列構成\(V\)的正交規範基底。QED
註記 4-3
給定正規矩陣\(A\in M_{n\times
n}(\mathbb{C})\)(即\(AA^\ast=A^\ast
A\)),則由這裡的定理7知存在由\(A\)的特徵向量構成的\(\mathbb{C}^n\)的正交規範基底。
類似的,給定對稱矩陣\(A\in M_{n\times
n}(\mathbb{R})\)(即\(A=A^t\)),則由這裡的定理10知存在由\(A\)的特徵向量構成的\(\mathbb{R}^n\)的正交規範基底。
定義 5:么正等價 (Unitarily Equivalent)
給定矩陣\(A,D\in M_{n\times n}(\mathbb{C})\),若存在么正矩陣\(Q\)使得\(D=Q^\ast AQ\),則稱\(A\)和\(D\)么正等價。
定義 5-1:正交等價 (Orthogonally Equivalent)
給定矩陣\(A,D\in M_{n\times n}(\mathbb{R})\),若存在正交矩陣\(Q\)使得\(D=Q^t AQ\),則稱\(A\)和\(D\)正交等價。
定理 6
給定矩陣\(A\in M_{n\times
n}(\mathbb{C})\),則\(A\)是正規的 iff. \(A\)么正等價於某個對角矩陣。
類似的,給定矩陣\(A\in M_{n\times
n}(\mathbb{R})\),則\(A\)是自伴隨的 iff. \(A\)正交等價於某個對角矩陣。
證明:兩種狀況的說明是類似的,這裡只說明\(F=\mathbb{C}\)的狀況。我們分成兩部分說明。
「\(\Rightarrow\)」:若\(A\)是正規的,則由註記4-3知存在由\(A\)的特徵向量構成的\(\mathbb{C}^n\)的正交規範基底\(\beta\)。令\(\gamma\)為\(\mathbb{C}^n\)的標準基底,並令\(Q\)為座標轉換矩陣\(Q=[I]^\gamma_\beta\)。由註記4-2知\(Q\)應是么正的,即\(Q^\ast=Q^{-1}\)。則由這裡的定理3知
\[
[A]_\beta=Q^{-1}[A]_\gamma Q=Q^\ast AQ
\] 而由定義知\([A]_\beta\)應是對角矩陣,即\([A]_\gamma=A\)么正等價於某個對角矩陣。
「\(\Leftarrow\)」:若\(A\)么正等價於某個對角矩陣\(D\) i.e. 存在么正矩陣\(Q\)使得\(A=Q^\ast
DQ\),其中\(Q^\ast=Q^{-1}\)。則
\[
\begin{aligned}
A^\ast A&=(Q^\ast DQ)^\ast (Q^\ast DQ)\\
&=(Q^\ast D^\ast Q)(Q^\ast DQ)\\
&=(Q^\ast D^\ast)(QQ^\ast)(DQ)\\
&=Q^\ast(D^\ast D)Q\\
&=Q^\ast(DD^\ast)Q\;(D\mbox{是對角矩陣})\\
&=(Q^\ast DQ)(Q^\ast D^\ast Q)=AA^\ast
\end{aligned}
\] 即\(A\)是正規的。QED
註記 7
給定\(F\)上的有限維內積空間\(V\)與自伴隨映射\(T:V\to V\),其中\(\dim V=n\)。並給定\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\),令\(A=[T]_\beta\)。則\(T\)是半正定的 iff. 存在某個矩陣\(B\)使得\(A=B^\ast
B\)(半正定的定義見這裡的定義12)。
證明:我們分兩個部分說明。
「\(\Rightarrow\)」:由於\(T\)是自伴隨的,故由定理6知存在么正矩陣\(P\)與對角矩陣\(D\)使得\(A=P^\ast
DP\),其中\(D\)的對角線元素為\(T\)的特徵值。由這裡的註記13知可以令
\[
D=\left(
\begin{array}{ccc}
\lambda_1 & & \\
& \ddots & \\
& & \lambda_n
\end{array}
\right),\lambda_i\geq 0
\] 於是,我們可以令 \[
E=\left(
\begin{array}{ccc}
\sqrt{\lambda_1} & & \\
& \ddots & \\
& & \sqrt{\lambda_n}
\end{array}
\right)
\] 於是便有 \[
A=P^\ast DP=(P^\ast E)(EP)
\] 令\(B=EP\)即得所求。
「\(\Leftarrow\)」:若存在\(B\)使得\(A=B^\ast
B\),則 \[
A=B^\ast B=B^\ast B^{\ast\ast}=(B^\ast B)^\ast=A^\ast
\] 故知\(A\)是自伴隨的。而給定\(y\in V\),可以令 \[
[y]_\beta=\left(
\begin{array}{c}
a_1\\
\vdots\\
a_n
\end{array}
\right)\in F^n
\] 則由這裡的註記14知
\[
(\overline{a_1},\cdots,\overline{a_n})(B^\ast B)\left(
\begin{array}{c}
a_1\\
\vdots\\
a_n
\end{array}
\right)=\langle T(y),y\rangle
\] 但 \[
\begin{aligned}
(\overline{a_1},\cdots,\overline{a_n})(B^\ast B)\left(
\begin{array}{c}
a_1\\
\vdots\\
a_n
\end{array}
\right)&=\sum_{i,j}\overline{a_i}(B^\ast B)_{ij}a_j\\
&=\sum_{i,j,k}\overline{a_i}B_{ik}^\ast B_{kj}a_j\\
&=\sum_k\left(\sum_i \overline{B_{ki}a_i}\right)\left(\sum_j
B_{kj}a_j\right)\\
&=\sum_{i,j,k,m}(B_{kj}a_j)(\overline{B_{mi}a_i})\langle
v_k,v_m\rangle\\
&(\langle v_k,v_m\rangle=\delta_{km})\\
&=\left\langle\sum_j\sum_kB_{kj}a_jv_k,\sum_i\sum_mB_{mi}a_iv_m\right\rangle\\
&=\langle By,By\rangle=\|By\|^2\geq 0
\end{aligned}
\] 故可知\(T\)是半正定的。QED
註記 8:舒爾定理 (Schur's Theorem)
給定\(B\in M_{n\times
n}(F)\),其中\(B\)的特徵多項式在\(F\)上分裂,則:
1. 若\(F=\mathbb{C}\),則\(B\)和某個上三角矩陣么正等價。
2.
若\(F=\mathbb{R}\),則\(B\)和某個上三角矩陣正交等價。
(這是這裡的定理4根據定理6的證明過程所做的改寫。)