永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:譜分解

這份筆記是關於譜分解的定義與性質,以及與同步對角化相關的定理。

正交投影的等價定義

註記 1

給定內積空間\(V\)及其子空間\(W\),並考慮\(V\)\(W\)上的正交投影\(\mbox{Proj}_W:V\to V\)。則\(R(\mbox{Proj}_W)=W\)(正交投影的定義可見這裡的定義4)。

證明:由定義顯然有\(R(\mbox{Proj}_W)\subseteq W\)。而若存在\(x\in W\)使得\(x\notin R(\mbox{Proj}_W)\)。則 \[ \underbrace{x}_{\in W}-\underbrace{\mbox{Proj}_W(x)}_{\in W}\in W \] 但由定義又有 \[ x-\mbox{Proj}_W(x)\in W^\perp \] 但又有\(W\cap W^\perp=\{0\}\),故\(x=\mbox{Proj}_W(x)\),即\(x\in W\)。矛盾,故\(R(\mbox{Proj}_W)=W\)QED

註記 2

給定內積空間\(V\)及其子空間\(W\),並考慮\(V\)\(W\)上的正交投影\(\mbox{Proj}_W:V\to V\)。則\(N(\mbox{Proj}_W)=W^\perp\)

證明:對於所有\(y\in W^\perp\),有 \[ y=\underbrace{0}_{\in W}+\underbrace{y}_{\in W^\perp} \]\(\mbox{Proj}_W(y)=0\),即\(W^\perp\subseteq N(\mbox{Proj}_W)\)
另一方面來說,給定\(y\in N(\mbox{Proj}_W)\),由正交投影的定義有 \[ y-\mbox{Proj}_W(y)=y-0=y\in W^\perp \]\(N(\mbox{Proj}_W)\subseteq W^\perp\)。於是有\(N(\mbox{Proj}_W)=W^\perp\)QED

定義 3:正交投影的另一種定義

給定內積空間\(V\)及線性映射\(T:V\to V\),且\(T=T^2\)。若\(T\)又滿足 \[ R(T)^\perp=N(T), N(T)^\perp=R(T) \] 則稱\(T\)為正交投影。

註記 3-1

定義3所定義的正交投影和這裡的定義4所定義的正交投影是等價的。

證明:我們分成兩個部分說明。
1. 這裡的定義4\(\Rightarrow\)定義3:考慮\(V\)的子空間\(W\)。令\(\mbox{Proj}_W:V\to W\)\(V\)\(W\)上的正交投影。由定義易知\((\mbox{Proj}_W)^2=\mbox{Proj}_W\)。而由註記1與註記2有 \[ R(\mbox{Proj}_W)^\perp=W^\perp=N(\mbox{Proj}_W) \] 我們希望說明\(N(\mbox{Proj}_W)^\perp=R(\mbox{Proj}_W)\)。由正交補餘的定義,顯然有 \[ R(\mbox{Proj}_W)\subseteq (R(\mbox{Proj}_W)^\perp)^\perp \] 假設存在\(y\in(W^\perp)^\perp\)使得\(y\notin W\)。則令 \[ y=\tilde{y}+\tilde{\tilde{y}},\tilde{y}\in W^\perp, \tilde{\tilde{y}}\in W \] 假設\(\tilde{y}\neq 0\),則 \[ \langle y,\tilde{y}\rangle=\langle \tilde{y},\tilde{y}\rangle+\langle \tilde{\tilde{y}},\tilde{y}\rangle=\langle \tilde{y},\tilde{y}\rangle\neq 0 \]\(\tilde{y}\in W^\perp\), \(y\in (W^\perp)^\perp\),故應有\(\langle y,\tilde{y}\rangle=0\),矛盾。故應有\(\tilde{y}=0\),即\(y=\tilde{\tilde{y}}\in W\)。於是有 \[ R(\mbox{Proj}_W)=(R(\mbox{Proj}_W)^\perp)^\perp=N(\mbox{Proj}_W)^\perp \]
2. 定義3\(\Rightarrow\)這裡的定義4:對於所有\(x\in V\),有 \[ x=T(x)+(x-T(x)) \]\(T(x)\in R(T)\)。且由\(T=T^2\)\[ T(x-T(x))=T(x)-T^2(x)=T(x)-T(x)=0 \]\(x-T(x)\in N(T)=R(T)^\perp\),於是有\(V=R(T)+R(T)^\perp\)
又假設存在另一組\(T(\tilde{x})\in R(T)\), \(x-T(\tilde{x})\in N(T)\)滿足 \[ x=T(x)+(x-T(x))=T(\tilde{x})+(x-T(\tilde{x})) \] 則由於\(x-T(x), x-T(\tilde{x})\in N(T)\),故 \[ \begin{aligned} &T((x-T(x))-(x-T(\tilde{x})))=0\\ \Rightarrow &0=T^2(x-\tilde{x})=T(x-\tilde{x})=T(x)-T(\tilde{x}) \end{aligned} \] 故有\(T(x)=T(\tilde{x})\),即\(V=R(T)\oplus N(T)\)。由這裡的註記4-1有\(T=\mbox{Proj}_{R(T)}\)QED

註記 4

給定內積空間\(V\)及其上的正交投影\(T:V\to V\),並給定\(v\in V\)。則對於所有\(w\in R(T)\),有 \[ \|w-v\|\geq\|T(v)-v\| \] (這個東西在這裡的註記2-1證明過了,但我們可以用此處的正交投影的定義再證一次。)

證明:我們有\(v=T(v)+(v-T(v))\),其中\(T(v)\in R(T)\), \(v-T(v)\in N(T)\)。而對於所有\(w\in R(T)\),有 \[ w-v=\underbrace{w-T(v)}_{\in R(T)}+\underbrace{(T(v)-v)}_{\in N(T)=R(T)^\perp} \]\[ \|w-v\|^2=\|w-T(v)\|^2+\|T(v)-v\|^2+\underbrace{2\langle w-T(v),T(v)-v\rangle}_{=0}\geq \|T(v)-v\|^2 \]\(\|w-v\|\geq\|T(v)-v\|\)QED

定理 5

給定內積空間\(V\)及其上的線性映射\(T:V\to V\),則\(T\)是正交投影 iff. \(T^2=T=T^\ast\)

證明:我們分成兩個部分證明。
\(\Rightarrow\)」:假設\(T\)是正交投影,則由定義有\(T^2=T\)。我們希望說明\(T^\ast\)存在且\(T=T^\ast\)(這裡的定理1證明過在\(\dim V<\infty\)的時候\(T^\ast\)總是存在,這裡要證明的狀況包含\(\dim V=\infty\))。
由於\(T\)是正交投影,故\(V=R(T)\oplus N(T)\),且\(R(T)^\perp=N(T)\), \(N(T)^\perp=R(T)\)。對於\(x,y\in V\),令 \[ x=x_1+x_2, y=y_1+y_2,\mbox{ where }x_1,y_1\in R(T), x_2,y_2\in N(T) \]\[ \begin{aligned} \langle x,T(y)\rangle&=\langle x_1+x_2,y_1\rangle\\ &=\langle x_1,y_1\rangle+\underbrace{\langle x_2,y_1\rangle}_{=0}\\ &=\langle x_1,y_1\rangle \end{aligned} \] 同理有\(\langle T(x),y\rangle=\langle x_1,y_1\rangle\)。故有 \[ \langle T(x),y\rangle=\langle x,T(y)\rangle=\langle x,T^\ast(y)\rangle \]\(T^\ast\)存在且\(T^\ast=T\)
\(\Leftarrow\)」:假設\(T^2=T=T^\ast\)。我們希望說明\(R(T)^\perp=N(T)\), \(N(T)^\perp=R(T)\)
\(x\in R(T)\), \(y\in N(T)\)。則應存在\(\tilde{x}\in V\)使得\(x=T(\tilde{x})=T^\ast(\tilde{x})\)。故 \[ \langle x,y\rangle=\langle T^\ast(\tilde{x}),y\rangle=\langle x,T(y)\rangle=\langle x,0\rangle=0 \]\(x\in N(T)^\perp\),即\(R(T)\subseteq N(T)^\perp\)
又另外給定\(z\in N(T)^\perp\),有 \[ \begin{aligned} \|y-T(y)\|^2&=\langle y-T(y),y-T(y)\rangle\\ &=\langle\underbrace{y}_{\in N(T)^\perp},\underbrace{y-T(y)}_{\in N(T)}\rangle-\langle T(y),y-T(y)\rangle\\ &=-\langle y,T^\ast(y-T(y))\rangle\\ &=-\langle y,\underbrace{T(y-T(y))}_{=0}\rangle=0 \end{aligned} \] 故知\(y=T(y)\),即\(y\in R(T)\)。於是有\(N(T)^\perp=R(T)\),即\(R(T)=N(T)^\perp\)
而再給定\(w\in R(T)^\perp\),則對於任何\(x\in V\),有 \[ \langle T(w),x\rangle=\langle w,T^\ast(x)\rangle=\langle \underbrace{w}_{\in R(T)^\ast},\underbrace{T(y)}_{\in R(T)}\rangle=0 \]\(x=T(w)\)即有\(T(w)=0\),故\(w\in N(T)\),即\(R(T)^\perp\subseteq N(T)\)
最後,由\(R(T)=N(T)^\perp\),我們直接有 \[ N(T)\subseteq (N(T)^\perp)^\perp=R(T)^\perp \] 於是有\(R(T)^\perp=N(T)\)QED

譜分解

定理 6:譜定理 (Spectral Theorem)

給定\(F\)上的有限維內積空間\(V\)及其上的線性映射\(T:V\to V\)。並且:
A. 若\(F=\mathbb{C}\),令\(T\)是正規映射。
B. 若\(F=\mathbb{R}\),令\(T\)是自伴隨映射。
意即,假設存在由\(T\)特徵向量構成的\(V\)的正交規範基底(見這裡的定理7與定理10)。並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)所有的特徵值,且其對應的特徵空間為\(W_1,W_2,\cdots,W_k\),則:
1. \(V=W_1\oplus W_2\oplus\cdots\oplus W_k\)
2. 令 \[ W_i'=W_1\oplus\cdots\oplus W_{i-1}\oplus W_{i+1}\oplus\cdots\oplus W_k \]\(W_i^\perp=W'_i\)
3. 令\(T_i\)\(V\)\(W_i\)上的正交投影,\(1\leq i\leq k\),則\(T_iT_j=\delta_{ij}T_i\)
4. \(I=T_1+T_2+\cdots+T_k\)
5. \(T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k\)

證明:
1. 由假設知\(T\)可對角化,故由這裡的定理15知 \[ V=W_1\oplus W_2\oplus\cdots\oplus W_k \]
2. 給定\(x\in W_i\), \(y\in W_j\),其中\(i\neq j\)。則由這裡的定理6第4.點知\(\langle x,y\rangle=0\),故應有\(W_i'\subseteq W_i^\perp\)。然而 \[ \dim W_i'=\dim V-\dim W_i=\dim W_i^\perp \]\(W_i'=W_i^\perp\)
3. 對於\(i\neq j\)\(x\in V\),由於\(T_j(x)\in W_j\)\(W_j\subseteq W'_i\),故 \[ T_iT_j(x)=T_i(T_j(x))=0 \] 而若\(i=j\),則\(T_iT_j=T_i^2=T_i\)
4. 對於所有\(x\in V\),可以令 \[ x=x_1+x_2+\cdots+x_k, x_i\in W_i, 1\leq i\leq k \] 然而\(T_i\)\(W_i\)上的正交投影,故\(T_i(x)=x_i\)。而 \[ \begin{aligned} I(x)=x&=x_1+x_2+\cdots+x_k\\ &=T_1(x)+T_2(x)+\cdots+T_k(x)\\ &=(T_1+T_2+\cdots+T_k)(x),\forall x\in V \end{aligned} \] 故有\(I=T_1+T_2+\cdots+T_k\)
5. 對於所有\(x\in V\),和第4.點中一樣考慮\(x=x_1+x_2+\cdots+x_k\)。則由於\(x_i\in W_i\),故 \[ \begin{aligned} T(x)&=T(x_1)+T(x_2)+\cdots+T(x_k)\\ &=\lambda_1x_1+\lambda_2x_2+\cdots+\lambda_kx_k\\ &=\lambda_1T(x)+\lambda_2T(x)+\cdots+\lambda_kT(x)\\ &=(\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k)(x) \end{aligned} \] 故有\(T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k\)QED

定義 6-1:譜 (Spectrum)

定理6中的\(\{\lambda_1,\lambda_2,\cdots,\lambda_k\}\)稱為\(T\)的譜。

定義 6-2:單位分解 (Resolution of Identity)

定理6中的\(I=T_1+T_2+\cdots+T_k\)稱為由\(T\)導出的單位分解。

定義 6-3:譜分解 (Spectral Decomposition)

定理6中的\(T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k\)稱為\(T\)的譜分解。

註記 6-4

給定有限維內積空間\(V\)及其上的線性映射\(T:V\to V\)。令 \[ T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k \]\(T\)的譜分解。並令\(g(t)\)為多項式。則由定理6的第3.點易得 \[ \begin{aligned} g(T)&=g(\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k)\\ &=g(\lambda_1)T_1+g(\lambda_2)T_2+\cdots+g(\lambda_k)T_k \end{aligned} \]

推論 6-5

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的線性映射\(T:V\to V\),則\(T\)是正規的 iff. 存在某個多項式\(g\)使得\(T^\ast=g(T)\)

證明:我們分成兩個部分說明。
\(\Leftarrow\)」:若\(T^\ast=g(T)\),則 \[ TT^\ast=Tg(T)=g(T)T=T^\ast T \]\(T\)是正規的。
\(\Rightarrow\)」:由於\(T\)是正規的,故由定理6知\(T\)有譜分解 \[ T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k \] 故有 \[ T^\ast=\overline{\lambda_1}T^\ast_1+\overline{\lambda_2}T^\ast_2+\cdots+\overline{\lambda_k}T^\ast_k \] 然而由定義,\(T_i\)是正交投影,故由定理5知\(T^\ast_i=T_i\)。使用拉格朗日插值法可以找到多項式\(g\)滿足\(g(\lambda_i)=\overline{\lambda_i},\forall 1\leq i\leq k\)。故有 \[ \begin{aligned} g(T)&=g(\lambda_1)T_1+g(\lambda_2)T_2+\cdots+g(\lambda_k)T_k\\ &=\overline{\lambda_1}T^\ast_1+\overline{\lambda_2}T^\ast_2+\cdots+\overline{\lambda_k}T^\ast_k\\ &=T^\ast \end{aligned} \] QED

推論 6-6

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的線性映射\(T:V\to V\),若\(T\)是正規的且所有\(T\)的特徵值\(\lambda\)都滿足\(|\lambda|=1\),則\(T\)是么正映射。
(這是這裡的註記3-1的前半部,此處提供另一種說明。)

證明:由於\(T\)是正規的,故由定理6知\(T\)存在譜分解 \[ T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k \] 又所有\(T\)的特徵值\(\lambda_i\)都滿足\(|\lambda_i|=1\),故 \[ \begin{aligned} TT^\ast&=(\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k)(\overline{\lambda_1}T^\ast_1+\overline{\lambda_2}T^\ast_2+\cdots+\overline{\lambda_k}T^\ast_k)\\ &=\lambda_1\overline{\lambda_1}T_1+\cdots+\lambda_k\overline{\lambda_k}T_k\;\;(\forall i\neq j, T_iT_j=0)\\ &=T_1+T_2+\cdots+T_k=I=T^\ast T \end{aligned} \]\(T\)是么正映射。QED

推論 6-7

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的正規線性映射\(T:V\to V\),則\(T\)是自伴隨的 iff. \(T\)所有的特徵值都是實數。

證明:我們分成兩個部分說明。
\(\Rightarrow\)」:這是這裡的引理9。
\(\Leftarrow\)」:由於\(T\)是正規的,故由定理6知\(T\)有譜分解 \[ T=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k \]\(T\)所有的特徵值都是實數,故 \[ \begin{aligned} T^\ast&=\overline{\lambda_1}T^\ast_1+\overline{\lambda_2}T^\ast_2+\cdots+\overline{\lambda_k}T^\ast_k\\ &=\lambda_1T_1+\lambda_2T_2+\cdots+\lambda_kT_k=T \end{aligned} \]\(T\)是自伴隨的。QED

同步對角化

註記 7

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的正規線性映射\(T, U:V\to V\)。若\(TU=UT\),則\(T^\ast U=UT^\ast\)

證明:由於\(T\)是正規的,故由推論6-5知存在多項式\(g\)使得\(T^\ast=g(T)\)。故 \[ T^\ast U=g(T)U=Ug(T)=UT^\ast \] QED

註記 8

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的正規線性映射\(T:V\to V\),並給定\(V\)的子空間\(W\)。若\(W\)\(T\)-不變的,則\(W^\perp\)\(T^\ast\)-不變的。

證明:對於所有\(w\in W^\perp\), \(v\in W\),有\(\langle v,w\rangle=0\)。而又因為\(W\)\(T\)-不變的,故\(T(v)\in W\)。於是 \[ \langle v,T^\ast(w)\rangle=\langle T(v),w\rangle=0 \]\(T^\ast(w)\in W^\perp\),即\(W^\perp\)\(T^\ast\)不變的。QED

定理 9:同步對角化 (Simultaneous Diagonalization)

給定\(F=\mathbb{C}\)上的有限維內積空間\(V\)及其上的正規線性映射\(T, U:V\to V\),滿足\(TU=UT\)。則\(T\)\(U\)可以同步對角化,即存在\(V\)的基底\(\beta\)使得\([T]_\beta\)\([U]_\beta\)都是對角矩陣。

證明:我們對\(V\)的維度進行數學歸納法。
1. \(\dim V=1\)時,結論是顯然的。
2. 假設\(\dim V\leq n\)時結論都成立,則當\(\dim V=n+1\)時,考慮\(W=E_\lambda\)\(T\)對應特徵值\(\lambda\)的特徵空間。對於\(w\in W\),有 \[ T(T(w))=T(\lambda w)=\lambda T(w) \]\(T(w)\in W\),故知\(E_\lambda\)\(T\)-不變的。而對於所有\(x\in E_\lambda\),又有 \[ TU(x)=UT(x)=U(\lambda x)=\lambda U(x) \]\(U(x)\in E_\lambda\),故\(E_\lambda\)也是\(U\)-不變的。而由於\(T\)是正規的,故對於所有\(x\in E_\lambda\),有 \[ T(T^\ast(x))=T^\ast(T(x))=T^\ast(\lambda x)=\lambda T^\ast(x) \]\(T^\ast(x)\in W\)\(E_\lambda\)也是\(T^\ast\)不變的。我們接著希望說明\(E_\lambda\)\(U^\ast\)不變的。由註記7可知\(U^\ast T=TU^\ast\),故對於所有\(x\in E_\lambda\),有 \[ TU^\ast(x)=U^\ast T(x)=\lambda U^\ast(x) \]\(U^\ast(x)\in E_\lambda\)\(E_\lambda\)\(U^\ast\)不變的。故由註記8,我們可以知道\(W^\perp\)\(T\)-不變、\(U\)-不變、\(T^\ast\)-不變及\(U^\ast\)不變的(前兩項來自\(W\)\(T^\ast\)-不變及\(U^\ast\)不變,後兩項來自\(W\)\(T\)-不變及\(U\)-不變)。故\(T_W, U_W, T_{W^\perp}, U_{W^\perp}\)都是正規的,且 \[ TU=UT, T_WU_W=U_WT_W, T_{W^\perp}U_{W^\perp}=U_{W^\perp}T_{W^\perp} \]\(\dim W,\dim W^\perp<\dim V\),故由歸納假設知\(T_W\)\(U_W\)可同步對角化,\(T_{W^\perp}\)\(U_{W^\perp}\)可同步對角化。而\(V=W\oplus W^\perp\),故\(T\)\(U\)可同步對角化。故由數學歸納法知此定理對任意\(\dim V=n\)都成立。QED

在實數上,也有類似的定理。證明是相似的。

定理 9-1

給定\(F=\mathbb{R}\)上的有限維內積空間\(V\)及其上的自伴隨線性映射\(T, U:V\to V\),滿足\(TU=UT\),則\(T\)\(U\)可以同步對角化。