這份筆記是關於伴隨映射的定義與性質。
這裡的行與列依循的是台灣的翻譯習慣,即行對應到英文的Column,而列對應到英文的Row。
伴隨映射
定理 1
給定有限維內積空間\(V\),並給定線性映射\(T:V\to V\)。則存在唯一的線性映射\(T^\ast:V\to V\)使得對於所有\(x,y\in V\)有\(\langle T(x),y\rangle=\langle
x,T^\ast(y)\rangle\)。
證明:固定\(y\in V\),令\(g:V\to F\)為映射\(g(x)=\langle
T(x),y\rangle\)。由里斯表現定理(這裡的定理9)知應存在\(y'\in V\)使得 \[
g(x)=\langle T(x),y\rangle=\langle x,y'\rangle,\forall x\in V
\] 令\(T^\ast:V\to
V\)為映射\(T^\ast(y)=y'\)。我們希望說明這樣的\(T^\ast\)確實是線性映射且是唯一的。
1.
\(T^\ast\)是線性映射:給定\(x,y_1,y_2\in V\), \(c\in F\),有 \[
\begin{aligned}
\langle x,T^\ast(cy_1+y_2)\rangle&=\langle T(x),cy_1+y_2\rangle\\
&=\overline{c}\langle T(x),y_1\rangle+\langle T(x),y_2\rangle\\
&=\overline{c}\langle x,T^\ast(y_1)\rangle+\langle
x,T^\ast(y_2)\rangle\\
&=\langle x,cT^\ast(y_1)+T^\ast(y_2)\rangle
\end{aligned}
\] 這對所有\(x\in
V\)都成立,,故有\(T^\ast(cy_1+y_2)=cT^\ast(y_1)+T^\ast(y_2)\),即\(T^\ast\)是線性的。
2. \(T^\ast\)是唯一的:假設另一線性映射\(U:V\to V\)也滿足條件,則對於所有\(x\in V\),有 \[
\langle T(x),y\rangle=\langle x,U(y)\rangle=\langle x,T^\ast(y)\rangle
\] 也就是對於所有\(x\in V\),有
\[
\langle x,T^\ast(y)-U(y)\rangle=0
\] 於是便有\(T^\ast=U\),即\(T^\ast\)是唯一的。QED
定義 1-1:伴隨映射 (Adjoint Transformation)
我們將定理1中的\(T^\ast\)稱為\(T\)的伴隨映射。
性質 1-1-1
底下給出五個顯然的伴隨映射的性質。其中\(T,U:V\to V\)是線性映射,\(c\in F\)是純量。
1. \((T+U)^\ast=T^\ast+U^\ast\)
2. \((cT)^\ast=\overline{c}T^\ast\)
3. \((TU)^\ast=U^\ast T^\ast\)
4. \(T^{\ast\ast}=T\)
5. 令\(I\)為單位映射,則\(I^\ast=I\)
定理 2
給定有限維內積空間\(V\),並給定線性映射\(T:V\to V\)。令\(\beta\)是\(V\)的正交規範基底,則 \[
[T^\ast]_\beta=[T]_\beta^\ast
\] (這裡\(A^\ast\)的意思是矩陣的伴隨,見這裡的定義2)。
證明:令\(A=[T]_\beta\),\(B=[T^\ast]_\beta\),並令 \[ \beta=\{v_1,v_2,\cdots,v_n\} \] 由這裡的註記10-2知 \[ \begin{aligned} B_{ij}&=\langle T^\ast(v_j),v_i\rangle\\ &=\overline{\langle v_i,T^\ast(v_j)\rangle}\\ &=\overline{\langle T(v_i),v_j\rangle}=\overline{A_{ji}} \end{aligned} \] 故有\(B=A^\ast\), \(A=B^\ast\)。QED
正規映射
今考慮內積空間\(V\)與線性映射\(T:V\to V\)。我們想知道\(T\)滿足什麼條件時,會存在某個\(V\)的正交規範基底\(\beta\)使得\(\beta\)由\(T\)的特徵向量構成(在這個狀況下,\(T\)可以被對角化)。
引理 3
給定內積空間\(V\)與線性映射\(T:V\to V\)。若\(T\)有特徵向量,則\(T^\ast\)也有。
證明:假設存在\(0\neq v\in V\)使得\(Tv=\lambda v\),則對於所有\(x\in V\),有 \[ \begin{aligned} 0=\langle 0,x\rangle&=\langle (T-\lambda I)(v),x\rangle\\ &=\langle v,(T-\lambda I)^\ast(x)\rangle\\ &=\langle v,(T^\ast-\overline{\lambda}I)(x)\rangle \end{aligned} \] 故\(v\)和\(R(T^\ast-\overline{\lambda}I)\)中的所有元素正交,即\(v\in(R(T^\ast-\overline{\lambda}I))^\perp\)。由\(v\neq 0\)知\(v\notin R(T^\ast-\overline{\lambda}I)\)。於是,我們知道\((T^\ast-\overline{\lambda}I)\)不是映成的,但其定義域與對應域都是\(V\)。故由維度定理(這裡的定理8)我們知道 \[ \dim N(T^\ast-\overline{\lambda}I)>0 \] 即\(N(T^\ast-\overline{\lambda}I)\neq\{0\}\)。於是,存在非零的\(v'\in V\)使得\((T^\ast-\overline{\lambda}I)(v')=0\)。即\(v'\)是\(T^\ast\)的特徵向量,其對應特徵值為\(\overline{\lambda}\)。QED
定理 4:舒爾定理 (Schur's Theorem)
給定有限維內積空間\(V\)及線性映射\(T:V\to V\)。若\(T\)的特徵多項式分裂,則存在\(V\)的正交規範基底\(\beta\)使得\([T]_\beta\)是上三角矩陣。
證明 1:由於\(T\)的特徵多項式分裂,故由這裡的定理11知存在\(V\)的基底\(\beta'\)使得\([T]_{\beta'}\)是約旦典型形式,而約旦典型形式是上三角矩陣。接著對\(\beta'\)做格蘭-施密特正交化過程(這裡的定理10),可以得到\(V\)的正交規範基底\(\beta\)。由格蘭-施密特正交化過程的步驟易知\([T]_\beta\)也是上三角矩陣。QED
證明 2:我們對\(V\)的維度做數學歸納法。
1. 當\(\dim V=1\)時,結論是顯然的。
2.
假設當\(\dim
V=n-1\)時定理成立,則當\(\dim
V=n\)時,由\(T\)的特徵多項式分裂知\(T\)有特徵向量,而由引理3我們知道若\(T^\ast\)也會有特徵向量。令\(z\in V\)是\(T^\ast\)的特徵向量,其中\(T^\ast(z)=\lambda z\)。令\(W=\mbox{span}(\{z\})\),我們希望說明\(W^\perp\)是\(T\)-不變的。
給定\(y\in W^\perp\)與\(x=cz\in W\),我們有 \[
\langle T(y),x\rangle=\langle y,T^\ast(x)\rangle=\langle y,c\lambda
z\rangle=\overline{c\lambda}\langle y,z\rangle
\] 但\(y\in W^\perp\), \(z\in W\),故\(\langle y,z\rangle=0\)。即 \[
\forall x\in W, \langle T(y),x\rangle=0
\] 故\(T(y)\in
W^\perp\),即\(W^\perp\)確實是\(T\)-不變的。
於是,由這裡的定理4,我們知道\(T_{W^\perp}\)的特徵多項式整除\(T\)的特徵多項式。故\(T_{W^\perp}\)的特徵多項式分裂且 \[
\dim W^\perp=n-1=\dim V-\dim W
\] (見這裡的定理3),故由歸納假設知存在\(W^\perp\)的正交規範基底\(\gamma\)使得\([T_{W^\perp}]_\gamma\)是上三角矩陣。而令
\[
\beta=\underbrace{\gamma}_{\in W^\perp}\cup\underbrace{\{z\}}_{\in W}
\] 則 \[
[T]_\beta=\left(
\begin{array}{c|c}
[T_{W^\perp}]_{\gamma} & \ast\\
\hline
0 & \ast
\end{array}
\right)
\] 其最後一行是\([T(z)]_\beta\)。可以發現\([T]_\beta\)也是上三角矩陣。
由數學歸納法,我們知道定理對任何\(\dim
V\)都成立。QED

定義 5:正規 (Normal)
定義 5-1:正規映射 (Normal Transformation)
給定有限維內積空間\(V\)及線性映射\(T:V\to V\)。若\(T^\ast T=TT^\ast\),則我們稱\(T\)是正規的。
定義 5-2:正規矩陣 (Normal Matrix)
給定\(A\in M_{n\times n}(F)\), \(F=\mathbb{R}\)或\(\mathbb{C}\)。若\(A^\ast A=AA^\ast\),則我們稱\(A\)是正規的。
定理 6
給定有限維內積空間\(V\)及正規線性映射\(T:V\to V\)。則:
1. \(\forall x\in V\), \(\|T(x)\|=\|T^\ast(x)\|\)
2. \(\forall c\in F\),\(T-cI\)是正規的。
3. 「\(x\)是\(T\)的特徵向量,其對應特徵值為\(\lambda\)」 iff. 「\(x\)是\(T^\ast\)的特徵向量,其對應特徵值為\(\overline{\lambda}\)」。
4. 若\(\lambda_1, \lambda_2\)是\(T\)的兩個相異特徵值,且其分別對應的特徵向量是\(x_1,x_2\),則\(\langle x_1,x_2\rangle=0\)。
證明:
1. 對於所有\(x\in V\),我們有 \[
\begin{aligned}
\|T(x)\|^2&=\langle T(x),T(x)\rangle\\
&=\langle x,T^\ast T(x)\rangle\\
&=\langle x,TT^\ast(x)\rangle\\
&=\langle T^\ast(x),T^\ast(x)\rangle\\
&\mbox{(註記1-1-1第4點)}\\
&=\|T^\ast(x)\|^2
\end{aligned}
\] 即\(\|T(x)\|=\|T^\ast(x)\|\)。
2.
由註記1-1-1有\((T-cI)^\ast=T^\ast-\overline{c}I\)。故
\[
\begin{aligned}
(T-cI)(T-cI)^\ast&=(T-cI)(T^\ast-\overline{c}I)\\
&=TT^\ast-cT^\ast-\overline{c}T+c\overline{c}I\\
&=T^\ast T-\overline{c}T-cT^\ast+\overline{c}cI\\
&=(T^\ast-\overline{c}I)(T-cI)=(T-cI)^\ast(T-cI)
\end{aligned}
\] 即\((T-cI)\)是正規的。
3.
由註記1-1-1第4.點知\(T^{\ast\ast}=T\),故我們只需要證明其中一個方向就好。給定\(T(x)=\lambda x\),令\(U=T-\lambda I\),則\(U(x)=0\)。由第2.點,我們知道\(U\)是正規的,故由第1.點知 \[
0=\|U(x)\|=\|U^\ast(x)\|=\|T^\ast-\overline{\lambda}I(x)\|
\] 故\((T^\ast-\lambda
I)(x)=0\),即\(T^\ast\)的特徵向量是\(x\),其對應的特徵值是\(\overline{\lambda}\)。
4. 我們有 \[
\langle
T(x_1),x_2\rangle=\langle\lambda_1x_1,x_2\rangle=\lambda_1\langle
x_1,x_2\rangle
\] 然而由第3.點又有 \[
\langle T(x_1),x_2\rangle=\langle x,T^\ast(y)\rangle=\langle
x_1,\overline{\lambda_2}x_2\rangle=\lambda_2\langle x_1,x_2\rangle
\] 故有\(\lambda_1\langle
x_1,x_2\rangle=\lambda_2\langle x_1,x_2\rangle\)。又\(\lambda_1\neq\lambda_2\),故\(\langle
x_1,x_2\rangle=0\)。QED
定理 7
給定\(\mathbb{C}\)上的有限維內積空間\(V\)及正規線性映射\(T:V\to V\)。則\(T\)是正則的若且唯若存在由\(T\)的特徵向量構成的\(V\)的正交規範基底。
證明:我們分成兩部分證明。
「\(\Rightarrow\)」:假設\(T\)是正規的。我們首先知道\(T\)的特徵多項式一定在\(\mathbb{C}\)上分裂。由定理4,我們知道存在\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)使得\([T]_\beta\)是上三角矩陣。於是,我們知道\(v_1\)是\(T\)的特徵向量。我們接著希望說明若\(v_1,v_2,\cdots,v_{k-1}\)都是\(T\)的特徵向量的話,則\(v_k\)也是\(T\)的特徵向量。
對於\(j=1\sim k-1\),令\(T(v_j)=\lambda_jv_j\)。因為\(T\)是正規的,故由定理6第3.點知\(T^\ast(v_j)=\overline{\lambda_j}v_j\)。又由於\([T]_\beta\)是上三角矩陣,故可以令 \[
T(v_k)=A_{ik}v_1+A_{2k}v_2+\cdots+A_{kk}v_k
\] 而對於所有\(j<k\),由這裡的註記10-2可知
\[
A_{jk}=\langle T(v_k),v_j\rangle=\langle v_k,T^\ast(v_j)\rangle=\langle
v_k,\overline{\lambda_j}v_j\rangle=\lambda_j\langle v_k,v_j\rangle=0
\] 故知\(T(v_k)=A_{kk}v_k\),即\(v_k\)也是\(T\)的特徵向量。而由於一開始我們知道\(v_1\)是\(T\)的特徵向量,故\(\beta=\{v_1,v_2,\cdots,v_n\}\)中全部都是\(T\)的特徵向量。
「\(\Leftarrow\)」:若某個\(V\)的正交規範基底\(\beta=\{v_1,v_2,\cdots,v_n\}\)是由\(T\)的特徵向量構成的,則令\(A=[T]_\beta\)。由這裡的註記10-2有
\[
A_{ij}=\langle T(v_j),v_i\rangle=\langle \lambda_jv_j,v_i\rangle
\] 其中\(\lambda_j\)是特徵向量\(v_j\)對應的特徵值。由於\(\beta\)是正交的,故可以得知\(A\)是對角矩陣。而由定理2有 \[
[T^\ast]_\beta=[T]_\beta^\ast=A^\ast
\] 故 \[
\begin{aligned}
\left[TT^\ast\right]_\beta&=[T]_\beta[T^\ast]_\beta\\
&=AA^\ast=A^\ast A\\
&=[T^\ast]_\beta[T]_\beta=[T^\ast T]_\beta
\end{aligned}
\] 即\(TT^\ast=T^\ast T\) i.e.
\(T\)是正規的。QED
註記 7-1
由於在實數上線性映射\(T\)的特徵多項式不一定會分裂,故在實數上定理7不一定會成立。
例 7-1-1
考慮\(M_{2\times
2}(\mathbb{R})\)中的矩陣 \[
A=\left(
\begin{array}{cc}
\cos\theta & -\sin\theta\\
\sin\theta & \cos\theta
\end{array}
\right)
\] 這是旋轉矩陣,其在\(\mathbb{R}^2\)上沒有特徵向量,但卻確實有\(AA^\ast=A^\ast A\)。
於是,在實數上要存在由\(T\)的特徵向量構成的\(V\)的正交規範基底,需要\(T\)滿足更強的條件。
自伴隨映射
定義 8:自伴隨 (Self-Adjoint)
定義 8-1:自伴隨映射 (Self-Adjoint Transformation)
給定有限維內積空間\(V\)及線性映射\(T:V\to V\)。若\(T^\ast=T\),則我們稱\(T\)是自伴隨的。
定義 8-2:自伴隨矩陣 (Self-Adjoint Matrix)
給定\(A\in M_{n\times n}(F)\), \(F=\mathbb{R}\)或\(\mathbb{C}\)。若\(A^\ast=A\),則我們稱\(A\)是自伴隨的。
引理 9
給定有限維內積空間\(V\)及線性映射\(T:V\to V\)。若\(T^\ast=T\),則:
1. \(T\)的所有特徵值都是實數。
2. 若\(V\)是實數上的內積空間,則\(T\)的特徵多項式在實數上分裂。
證明:
1. 令\(x\in V\)為\(T\)的特徵向量,即有\(\lambda\neq 0\)使得\(T(x)=\lambda x\)。又因為\(T\)是自伴隨的,故由定義知\(T\)是正規的。故由定理6第3.點知 \[
\lambda x=T(x)=T^\ast(x)=\overline{\lambda}x
\] 故\(\lambda=\overline{\lambda}\),即\(\lambda\in\mathbb{R}\)。
2. 令\(\dim V=n\),並令\(\beta\)為\(V\)的正交規範基底。令\([T]_\beta=A\)。則由定理2知 \[
[T^\ast]_\beta=[T]^\ast_\beta=A^\ast
\] 然而\(T=T^\ast\),故\(A=A^\ast\)。定義線性映射\(T_A:\mathbb{C}^n\to\mathbb{C}^n\)為\(T(x)=Ax,\forall x\in V\)。令\(\gamma\)為\(\mathbb{C}^n\)的標準基底。則有\([T_A]_\gamma=A\),且 \[
[T^\ast_A]_\gamma=[T_A]^\ast_\gamma=A^\ast=A=[T_A]_\gamma
\] 故知\(T_A\)是自伴隨的。由第1.點知\(T_A\)所有的特徵值都是實數,故可令\(T_A\)的特徵多項式為 \[
f(t)=(-1)^n(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_n),\lambda_i\in\mathbb{R},\forall
i=1\sim n
\] 可以知道\(f(t)\)是\(A\)的特徵多項式,也是\(T\)的特徵多項式。故知\(T\)的特徵多項式在\(\mathbb{R}\)中分裂。QED
定理 10
給定實數上的有限維內積空間\(V\)及線性映射\(T:V\to V\)。則\(T=T^\ast\) iff. 存在由\(T\)的特徵向量構成的\(V\)的正交規範基底。
證明:我們分成兩部分證明。
「\(\Rightarrow\)」:由於\(T\)是自伴隨的,故由引理9知\(T\)的特徵多項式\(\mbox{char}(T)\in\mathbb{R}[t]\)在實數上分裂。則由定理4知存在\(V\)的正交規範基底\(\beta\)使得\(A=[T]_\beta\)是上三角矩陣。然而由定理2可知
\[
A=[T]_\beta=[T^\ast]_\beta=[T]^\ast_\beta=A^\ast
\] 故\(A\)應是對角矩陣,即\(\beta\)中都是\(T\)的特徵向量。
「\(\Leftarrow\)」:對於\(V\)的正交規範基底\(\beta\),令 \[
[T]_\beta=\left(
\begin{array}{ccc}
\lambda_1 & & \\
& \ddots & \\
& & \lambda_n
\end{array}
\right),\lambda_i\in\mathbb{R},\forall i=1\sim n
\] 而 \[
[T^\ast]_\beta=[T]^\ast_\beta=\left(
\begin{array}{ccc}
\overline{\lambda_1} & & \\
& \ddots & \\
& & \overline{\lambda_n}
\end{array}
\right)
\] 但由於\(\lambda_i\)都是實數,故有\([T]_\beta=[T^\ast]_\beta\),即\(T=T^\ast\)。QED
正定映射
定義 11:正定 (Positive-Definite)
定義 11-1:正定映射 (Positive-Definite Transformation)
給定內積空間\(V\)及線性映射\(T:V\to V\)。若\(T^\ast=T\)且對於所有\(x\in V\)有\(\langle T(x),x\rangle>0\),則我們稱\(T\)是正定的。
定義 11-2:正定矩陣 (Positive-Definite Matrix)
給定\(A\in M_{n\times n}(F)\), \(F=\mathbb{R}\)或\(\mathbb{C}\)。若\(L_A\)是正定映射,則我們稱\(A\)是正定矩陣。
定義 12:半正定 (Positive Semi-Definite)
定義 12-1:半正定映射 (Positive Semi-Definite Transformation)
給定內積空間\(V\)及線性映射\(T:V\to V\)。若\(T^\ast=T\)且對於所有\(x\in V\)有\(\langle T(x),x\rangle\geq 0\),則我們稱\(T\)是半正定的。
定義 12-2:半正定矩陣 (Positive Semi-Definite Matrix)
給定\(A\in M_{n\times n}(F)\), \(F=\mathbb{R}\)或\(\mathbb{C}\)。若\(L_A\)是半正定映射,則我們稱\(A\)是半正定矩陣。
註記 13
給定有限維內積空間\(V\)及線性映射\(T:V\to V\),其中\(\dim V=n\)。則\(T\)是正定的 iff. \(T\)所有的特徵值都是正的。
證明:我們分成兩部分證明。
「\(\Rightarrow\)」:已知\(T\)是正定的,由定義知\(T\)應是自伴隨的。故由定理10知存在某個\(V\)的正交規範基底\(\alpha=\{v_1,v_2,\cdots,v_n\}\),其中\(T(v_i)=\lambda_iv_i\), \(\lambda_i\in\mathbb{R}\), \(\forall i=1\sim n\)。對於任意\(x\in V\),可以令 \[
x=\sum_{i=1}^na_iv_i
\] 則由\(T\)是正定的知 \[
\begin{aligned}
\langle
0<T(x),x\rangle&=\left\langle\sum_{j=1}^nT(a_jv_j),\sum_{i=1}^na_iv_i\right\rangle\\
&=\sum_{i,j}\overline{a_i}a_j\lambda_j\langle v_j,v_i\rangle\\
&=\sum_{i=1}^n\overline{a_i}a_i\lambda_i\;(\alpha=\{v_1,v_2,\cdots,v_n\}\mbox{是正交規範的})
\end{aligned}
\] 這裡\(x\)是任意選定的,故
\[
\sum_{i=1}^n|a_i|^2\lambda_i>0,\forall a_i\in\mathbb{C}\mbox{ or
}\mathbb{R}
\] 故對於所有\(i\),應有\(\lambda_i>0\)。即\(T\)的特徵值都是正的。
「\(\Leftarrow\)」:沿用上面的符號。由上述知
\[
\langle T(x),x\rangle=\sum_{i=1}^n|a_i|^2\lambda_i
\] 由於\(\lambda_i\)都是正的,故對於所有\(x\in V\),應有\(\langle
T(x),x\rangle>0\)。QED
註記 14
給定有限維內積空間\(V\)及線性映射\(T:V\to V\),其中\(\dim V=n\)。給定\(V\)的正交規範基底\(\beta\)並令\([T]_\beta=A\)。則\(T\)是正定的 iff. 對於所有\((0,0,\cdots,0)\neq(a_1,a_2,\cdots,a_n)\in\mathbb{F}^n\)有 \[ \sum_{i,j}A_{ij}a_j\overline{a_i}>0 \]
證明:已知\(\beta=\{e_1,e_2,\cdots,e_n\}\)是正交規範基底,則對於\(x\in V\),可以令 \[ x=\sum_{i=1}^n a_ie_i \] 故有 \[ \begin{aligned} \langle T(x),x\rangle&=\left\langle T\left(\sum_{j=1}^n a_je_j,\sum_{i=1}^n a_ie_i\right)\right\rangle\\ &=\sum_{i,j}a_j\overline{a_i}\langle T(e_j),e_i\rangle\\ &=\sum_{i,j}A_{ij}a_j\overline{a_i} \end{aligned} \] 於是馬上就有所要的若且唯若的關係了。QED