這份筆記是關於矩陣的約旦典型形式的定義與性質,及其存在條件與求法。
廣義特徵空間
定義 1:約旦區塊 (Jordan Block)
我們令約旦區塊為矩陣 \[ \left( \begin{array}{cccccc} \lambda & 1 & & & & 0\\ & \lambda & 1 & & & \\ & & \lambda & 1 & & \\ & & & & \ddots & \\ 0 & & & & & \lambda \end{array} \right) \] 其特徵值為\(\lambda\)。
例 1-1
我們底下舉例幾個約旦區塊: \[ \begin{aligned} 2\times 2&:\left( \begin{array}{cc} \lambda & 1\\ 0 & \lambda \end{array} \right)\\ 3\times 3&:\left( \begin{array}{ccc} \lambda & 1 & 0\\ 0 & \lambda & 1\\ 0 & 0 & \lambda \end{array} \right)\\ 4\times 4&:\left( \begin{array}{cccc} \lambda & 1 & 0 & 0\\ 0 & \lambda & 1 & 0\\ 0 & 0 & \lambda & 1\\ 0 & 0 & 0 & \lambda \end{array} \right) \end{aligned} \]
定義 2:約旦典型形式 (Jordan Canonical Form)
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。若有\(V\)的基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} A_1 & & & 0\\ & A_2 & & \\ & & \ddots & \\ 0 & & & A_k \end{array} \right) \] 其中\(A_i\)為約旦區塊,則稱\([T]^\beta_\beta\)為\(T\)的約旦典型形式。
例 2-1
考慮矩陣 \[ A=\left( \begin{array}{cccccc} 2 & 1 & 0 & & & 0\\ 0 & 2 & 1 & & & \\ 0 & 0 & 2 & & & \\ & & & 3 & 1 & \\ & & & 0 & 3 & \\ 0 & & & & & 1 \end{array} \right) \] 則由行列式的置換定義(這裡的定理15)可以很容易算出其特徵多項式為\((2-t)^3(3-t)^2(1-t)\)。
定義 3:廣義特徵向量 (Generalized Eigenvector)
一個非零向量\(x\in V\)稱為線性映射\(T\)的一個廣義特徵向量(對應特徵值為\(\lambda\)),若存在某個正整數\(p\)使得 \[ (T-\lambda I)^p(x)=0 \]
例 3-1
考慮\(A\)同例2-1,令\(A=[T]^\beta_\beta\),並令\(\beta=\{v_1,v_2,\cdots,v_6\}\)。則有 \[ T(v_1)=2v_1, T(v_2)=v_1+2v_2, T(v_3)=v_2+2v_3 \] 則 \[ \begin{aligned} &(T-2I)(v_1)=0, (T-2I)(v_2)=v_1, (T-2I)(v_3)=v_2\\ \Rightarrow&(T-2I)(v_1)=(T-2I)^2(v_2)=(T-2I)^3(v_3)=0 \end{aligned} \] 即\(v_1,v_2,v_3\)都是\(T\)的廣義特徵向量,其對應特徵值為\(\lambda=2\)。
定義 4:廣義特徵空間 (Generalized Eigenspace)
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。我們稱\(T\)對應特徵值\(\lambda\)的廣義特徵空間\(K_\lambda\)為 \[ K_\lambda=\{x\in V:(T-\lambda I)^p(x)=0,\mbox{ for some positive integer }p\} \] 我們需要先說明\(K_\lambda\)真的是\(V\)的子空間。
註記 5
對於多項式\(g(t)\)與線性映射\(T:V\to V\),若子空間\(W\)是\(T\)-不變的,則\(W\)也是\(g(T)\)-不變的。(這是顯然的)
定理 6
給定線性映射\(T:V\to V\),並令\(\lambda\)為\(T\)的特徵值。則
1. \(K_\lambda\)是包含\(E_\lambda\)的\(V\)的\(T\)-不變子空間。
2. 對於所有\(\mu\neq\lambda\),\(T-\mu I\)在\(K_\lambda\)上的限制是一對一的。
證明:
1. 很容易可以知道\(0\in K_\lambda\)。而對於所有\(x,y\in K_\lambda\), \(c\in F\),存在\(p,q\)使得 \[
(T-\lambda I)^p(x)=0, (T-\lambda I)^q(cy)=0
\] 故 \[
(T-\lambda I)^{p+q}(x+cy)=(T-\lambda I)^{p+q}(x)+(T-\lambda
I)^{p+q}(cy)=0
\] 故\(x+cy\in
K_\lambda\),即\(K_\lambda\)是\(V\)的子空間。
而又顯然\(E_\lambda\)是蒐集所有\(p=1\)的廣義特徵向量,故\(E_\lambda\subseteq K_\lambda\)。且若\(x\in K_\lambda\),則\((T-\lambda I)^p(x)=0\),即 \[
(T-\lambda I)^p(T(x))=T(T-\lambda I)^p(x)=0
\] 於是\(T(x)\in
K_\lambda\),即\(K_\lambda\)是\(T\)-不變的。
2. 給定\(\mu\neq\lambda\),考慮\((T-\mu I)_{K_\lambda}\)的核。給定\(0\neq x\in K_\lambda\)並令 \[
(T-\mu I)(x)=0
\] 令\(p\)是使\((T-\lambda I)^p(x)=0\)成立的最小整數,即
\[
(T-\lambda I)^p(x)=0, (T-\lambda I)^{p-1}(x)\neq 0
\] 令\(y=(T-\lambda
I)^{p-1}(x)\),則 \[
(T-\lambda I)^p(x)=(T-\lambda I)(y)=0
\] 故\(y\in E_\lambda\)。而
\[
\begin{aligned}
(T-\mu I)(y)&=(T-\mu I)(T-\lambda I)^{p-1}(x)\\
&=(T-\lambda I)^{p-1}\underbrace{(T-\mu I)(x)}_{=0}=0
\end{aligned}
\] 故\(y\in E_\mu\),即\(y\in E_\lambda\cap E_\mu\),即\(y=0\)。這與一開始\(p\)的假設矛盾,故應有 \[
N((T-\mu I)_{K_\lambda})=\{0\}
\] 故由這裡的定理9可以知道\((T-\mu
I)_{K_\lambda}\)是一對一的。QED
定理 7
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda\)為\(T\)的特徵值,並假設\(T\)的特徵多項式分裂。令\(\lambda\)是\(T\)的特徵值,其重數為\(m\)。則
1. \(\dim(K_\lambda)\leq m\)
2. \(K_\lambda=N((T-\lambda I)^m)\)
證明:
1. 令\(W=K_\lambda\),則由定理6第1.點知\(W\)是\(T\)-不變的。令\(h(t)\)為\(T_W\)的特徵多項式,並令\(f(t)\)為\(T\)的特徵多項式。由這裡的定理4知\(h(t)|f(t)\)
(☆)。且由定理6第2.點,我們知道\(\lambda\)是\(T_W\)唯一的特徵值(不然如果\(\mu\neq\lambda\)也是\(T_W\)的特徵值的話,\((T-\mu
I)_{K_\lambda}\)就不是一對一的了)。故可以寫出 \[
h(t)=(-1)(t-\lambda)^d
\] 其中 \[
d=\dim W=\dim K_\lambda
\] 故由(☆)可知\(\dim K_\lambda=d\leq
m\)。
2. 由定義知\(N((T-\lambda
I)^m)\subseteq K_\lambda\)。由凱利-漢米爾頓定理(這裡的定理9)知\(h(T_W)=0\),故對於所有\(x\in W\)有 \[
(T_W-\lambda I)^d(x)=0
\] 又由第1.點知\(d\leq m\),故
\[
W=K_\lambda\subseteq N((T-\lambda I)^m)
\] 故有\(K_\lambda=N((T-\lambda
I)^m)\)。QED
定理 8
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)為\(T\)「所有」的特徵值,並假設\(T\)的特徵多項式分裂。則對於所有\(x\in V_i\),存在\(v_i\in K_{\lambda_i}\)使得 \[ x=v_1+v_2+\cdots+v_k \] 意即 \[ V=K_{\lambda_1}+K_{\lambda_2}+\cdots+K_{\lambda_k} \]
證明:我們對\(k\)做數學歸納法。
1. 當\(k=1\)時,令\(m=\mbox{multi}(\lambda_1)\),則\(T\)的特徵多項式為\((\lambda_1-t)^m\)。由凱利-漢米爾頓定理,我們有\((\lambda_1I-T)^m=0\)。故對於所有\(v\in V\),有 \[
(\lambda_1-t)^m(v)=0
\] 故知\(v\in K_{\lambda_1}\)。
2. 假設定理在\(T\)的特徵值個數比\(k\)個少時都成立,則當\(T\)有\(k\)個特徵值時,令\(m=\mbox{multi}(\lambda_k)\),則\(T\)的特徵多項式可寫為 \[
f(t)=(t-\lambda_k)^mg(t)
\] 其中\((t-\lambda_k)\nmid
g(t)\)。令 \[
W=R((T-\lambda_kI)^m)
\] 則對於所有\(w\in
W\),存在\(w'\in
V\)使得\(w=(T-\lambda_kI)^m(w')\)。故 \[
T(w)=T(T=\lambda_kI)^m(w')=(T-\lambda_kI)^m(T(w'))\in W
\] 故可知\(W\)是\(T\)-不變的。而考慮 \[
(T-\lambda_kI)_{K_{\lambda_i}}:K_{\lambda_i}\to K_{\lambda_i}, i=1\sim
k-1
\] (由定理6第1.點,我們知道\(K_{\lambda_i}\)是\(T\)-不變的。而由註記5,我們知道它也是\((T-\lambda_kI)\)-不變的)由定理6第2.點,我們知道上述映射是一對一的。而由這裡的性質1-6與這裡的註記2,我們知道\((T-\lambda_kI)_{K_{\lambda_i}}\)是一個同構映射。故
\[
(T-\lambda_kI)(K_{\lambda_i})=K_{\lambda_i}
\] 故由定義\(K_{\lambda_i}\subseteq
W\)。而由定理6的第1.點,我們有 \[
E_{\lambda_i}\subseteq K_{\lambda_i}\subseteq W, i=1\sim k-1
\] 考慮\(T_W:W\to W\)。由於\(E_{\lambda_i}\subseteq W\),故\(\lambda_i\)是\(T_W\)的特徵值, \(\forall i=1\sim k-1\)。我們希望說明\(\lambda_k\)不是\(T_W\)的特徵值。
若有\(0\neq v\in W\)使得\(T(v)=\lambda_kv\),則由定義知存在\(y\in V\)使得 \[
v=(T-\lambda_kI)^m(y)
\] 故 \[
0=(T-\lambda_kI)(v)=(T-\lambda_kI)^{m+1}(y)
\] 故\(y\in
K_{\lambda_k}=N((T-\lambda_kI)^m)\)(定理7第2.點)。故 \[
v=(T-\lambda_kI)^m(y)=0
\] 這和\(v\neq 0\)矛盾。故\(\lambda_1,\lambda_2,\cdots,\lambda_{k-1}\)是\(T_W\)所有的特徵值,但\(\lambda_k\)不是(之所以知道是「所有的」是因為\(T_W\)的特徵值都應該要是\(T\)的特徵值)。對\(T_W\)用歸納假設,令\(K_{\lambda_i}'\)為\(T_W\)對\(\lambda_i\)的廣義特徵空間,則對於所有\(x\in V\),存在\(w_i\in K_{\lambda_i}\), \(i=1\sim k-1\)使得 \[
(T-\lambda_kI)^m(x)=w_1+w_2+\cdots+w_{k-1}
\] (這裡有\((T-\lambda_kI)^m(x)\in
W\),所以可以是用歸納假設。)而由定義知\(K_{\lambda_i}'=K_{\lambda_i}\cap
W\)。又\((T-\lambda_kI)_{K_{\lambda_i}}\)是一個同構映射,故存在\(v_i\in K_{\lambda_i}\)使得 \[
(T-\lambda_kI)^m(v_i)=w_i
\] 故 \[
(T-\lambda_kI)^m(x)=(T-\lambda_kI)^m(v_1)+\cdots+(T-\lambda_kI)^m(v_{k-1})
\] 故\(x-v_1-v_2-\cdots-v_{k-1}\in
K_{\lambda_k}\)。令 \[
v_k=x-v_1-v_2-\cdots-v_{k-1}\in K_{\lambda_k}
\] 則有\(x=v_1+v_2+\cdots+v_k\)。故由數學歸納法知定理對任何\(k\)都成立。QED
定理 9
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)為\(T\)「所有」的特徵值,而\(m_1,m_2,\cdots,m_k\)為它們對應的重數,並假設\(T\)的特徵多項式分裂。令\(\beta_i\)是\(K_{\lambda_i}\)的有序基底。則
1. \(\forall i\neq j\), \(\beta_i\cap\beta_j=\varnothing\)
2.
\(\beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k\)是\(V\)的基底。(由這裡的定理14-1知這與
\[
V=K_{\lambda_1}\oplus K_{\lambda_2}\oplus\cdots\oplus K_{\lambda_k}
\] 等價。)
3. \(\dim
K_{\lambda_i}=m_i\)
證明:
1. 若存在 \[
0\neq x\in\beta_i\cup\beta_j\subseteq K_{\lambda_i}\cup K_{\lambda_j},
i\neq j
\] 則由定理8的推導過程知\((T-\lambda_iI)_{K_{\lambda_i}}\)是同構映射。而\(x\in K_{\lambda_i}\),故知對於所有\(p\)都有 \[
(T-\lambda_iI)^p(x)\neq 0
\] 然而這導致\(x\notin
K_{\lambda_i}\),矛盾。故\(\forall
i\neq j\), \(\beta_i\cap\beta_j=\varnothing\)。
2.
對於所有\(x\in V\),由定理8知存在\(v_i\in K_{\lambda_i}\)使得 \[
x=v_1+v_2+\cdots+v_k
\] 故\(x\in\mbox{span}(\beta_1\cup\beta_2\cup\cdots\cup\beta_k)\)。故有
\[
V=\mbox{span}(\beta_1\cup\beta_2\cup\cdots\cup\beta_k)
\] 又\(|\beta_i|=\dim K_{\lambda_i}\leq
m_i\)(定理7第1.點),故 \[
\dim V\leq\sum_{i=1}^k|\beta_i|\leq\sum_{i=1}^k m_i=\dim V
\] (最後的等於是因為\(T\)的特徵多項式分裂)故中間都是等號,即
\[
\dim V=\sum_{i=1}^k|\beta_i|
\] 即\(\beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k\)確是\(V\)的基底。
3.
由第2.點的推導過程直接可得\(|\beta_i|=\dim
K_{\lambda_i}=m_i\)。QED
循環
定義 10:循環 (Cycle)
給定線性映射\(T:V\to V\),其中\(0\neq x\)是\(T\)的廣義特徵向量,其對應的特徵值為\(\lambda\)。又令\(p\)是使\((T-\lambda I)^p(x)=0\)的最小整數。則令 \[ \{(T-\lambda I)^{p-1}(x),\cdots,(T-\lambda I)(x),x\} \] 為\(T\)對應特徵值\(\lambda\)的廣義特徵向量循環。
定義 10-1:始向量 (Initial Vector)
我們稱定義10中的\((T-\lambda I)^{p-1}(x)\)為始向量。
定義 10-2:末向量 (End Vector)
我們稱定義10中的\(x\)為末向量。
定理 11
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並假設\(T\)的特徵多項式分裂。如果\(V\)存在基底\(\beta\)使得\(\beta\)是\(T\)的廣義特徵向量的循環的互斥聯集,則
1. 對於任意\(\beta\)中的循環\(\gamma\),\(W=\mbox{span}(\gamma)\)是\(T\)-不變的,且\([T_W]^\gamma_\gamma\)是一個約旦區塊。
2. \(\beta\)是使\(T\)能表示成約旦典型形式的基底。
定義 11-1:互斥聯集 (Disjoint Union)
即許多兩兩交集為空的集合的聯集。
定義 11-2:約旦典型基底 (Jordan Canonical Basis)
一般稱定理11第2.點中的\(\beta\)為\(T\)的約旦典型基底。
證明:
1. 令\(\gamma\)的長度為\(p\)(即令\(|\gamma|=p\)),末向量為\(x\),對應的特徵值為\(\lambda\),則 \[
\gamma=\{\underbrace{v_1}_{(T-\lambda
I)^{p-1}(x)},\cdots,\underbrace{v_p}_{x}\}
\] 而對於所有\(i>1\),有\((T-\lambda I)(v_i)=v_{i-1}\),故 \[
T(v_i)=v_{i-1}+\lambda v_i\in W
\] 而\(i=1\)時亦有\(T(v_1)=\lambda v_1\in W\),故可知\(W\)是\(T\)-不變的。而由\(T(v_i)=v_{i-1}+\lambda v_i\)知 \[
[T_W]^\gamma_\gamma=\left(
\begin{array}{cccc}
\lambda & 1 & & 0\\
& \lambda & 1 & \\
& & \lambda & \\
0 & & & \ddots
\end{array}
\right)
\] 可以發現\([T_W]^\gamma_\gamma\)確實是約旦區塊。
2. 由\(\gamma\)之間彼此互斥就顯然可得了。QED
接著,我們要來說明定理11中那種\(\beta\)的存在性。
定理 12
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda\)為\(T\)的特徵值。令\(\gamma_1,\gamma_2,\cdots,\gamma_q\)為與\(\lambda\)相對應的廣義特徵向量循環,且\(\gamma_i\)的始向量們構成一個線性獨立的集合,則\(\gamma_i\)是互斥的,且 \[
\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_q
\] 是線性獨立的。
證明:我們分兩部分證明。
1.
我們希望說明\(\gamma_i\)是互斥的。若不然,則令 \[
(T-\lambda I)^{n_i}(x_i)=(T-\lambda I)^{n_j}(x_j)
\] 其中\(x_i,x_j\)是\(\lambda\)的相異廣義特徵向量。即 \[
(T-\lambda I)^{n_i}(x_i)\in\gamma_i, (T-\lambda I)^{n_j}(x_j)\in\gamma_j
\] 令\(l_i,l_j\)是\(\gamma_i,\gamma_j\)的長度。則比較\(l_i-n_i\)與\(l_j-n_j\)。假設\(l_j-n_j<l_i-n_i\),則 \[
(T-\lambda I)^{l_j-n_j}(T-\lambda I)^{n_i}(x_i)=(T-\lambda
I)^{l_j-n_j}(T-\lambda I)^{n_j}(x_j)=(T-\lambda I)^{l_j}(x_j)=0
\] 令\(\tilde{n_i}=l_j-n_j+n_i\),則 \[
\tilde{n_i}<l_i-n_i+n_i<l_i
\] 但\((T-\lambda
I)^{\tilde{n_i}}(x_i)=0\)。可以發現這裡矛盾了,故應有\(l_i-n_i=l_j-n_j\)。
然而,當\(l_i-n_i=l_j-n_j\)時,有 \[
\underbrace{(T-\lambda
I)^{l_i-1}(x_i)}_{\gamma_i\mbox{的始向量}}=\underbrace{(T-\lambda
I)^{l_j-1}(x_i)}_{\gamma_j\mbox{的始向量}}
\] 這和\(\gamma_i\)的始向量們線性獨立的假設矛盾。故\(\gamma_i\)之間應該是互斥的。
2.
我們希望說明\(\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_q\)是線性獨立的。我們對\(\gamma\)中的向量數\(N\)做數學歸納法。當\(N=1\)時,結論是顯然的。假設\(N=1,2,\cdots,n-1\)時定理成立,令\(|\gamma|=n\),並令\(W=\mbox{span}(\gamma)\)。由定理11第1.點可知\(W\)是\((T-\lambda
I)\)-不變的,且\(\dim W\leq
n\)。考慮線性映射\(U=(T-\lambda
I)_W:W\to W\)。則對於\(i=1,2,\cdots,q\),令 \[
\gamma_i'=\gamma_i-\{\gamma_i\mbox{的末向量}\}
\] (上面的減號是指差集)。則有 \[
\gamma_i=\{x,\underbrace{(T-\lambda I)(x),(T-\lambda
I)^2(x),\cdots,(T-\lambda
I)^{l-1}(x)}_{\gamma_i'}\}\supseteq\gamma_i'
\] 故可以發現每個\(\gamma_i'\)中的向量都是某個\(\gamma_i\)中的向量在\(U\)下的像 i.e. \(\forall v\in\gamma_i'\),存在\(w\in\gamma_i\)使得\(U(w)=v\)。令 \[
\gamma'=\gamma_1'\cup\gamma_2'\cup\gamma_3'\cup\cdots\cup\gamma_q',
|\gamma'|<n
\] 由歸納假設,我們知道\(\gamma'\)是線性獨立的。
接著,我們知道\(U(\gamma)=\gamma'\)(其實會有幾項\(\gamma\)的元素\(v\)導致\(U(v)=0\)(即各循環的始向量),但我們先略過它們。)由定義知\(U\)的定義域是\(W=\mbox{span}(\gamma)\),故可知\(\gamma'\)是\(R(U)\)的基底,即\(\dim R(U)=n-q\)。而又因為\(N(U)\)中有\(q\)個線性獨立的始向量\((T-\lambda I)^{l_i-1}(x_i)\)(這裡有 \[
(T-\lambda I)(T-\lambda I)^{l_i-1}(x_i)=(T-\lambda I)^{l_i}(x_i)=0
\] 故有\((T-\lambda I)^{l_i-1}(x_i)\in
N(U)\)。),故\(\dim N(U)\geq
q\)。故 \[
n\geq \dim W=\dim R(U)+\dim N(U)\geq (n-q)+q=n
\] 故中間每一個大於等於其實都是等於,即\(\dim W=\dim(\mbox{span}(\gamma))=n\) i.e.
\(\gamma\)是線性獨立的。
由數學歸納法,我們可以知道\(\gamma=\gamma_1\cup\cdots\cup\gamma_q\)總是線性獨立的。QED
註記 12-1
由定理12可知所有廣義特徵向量的循環都是線性獨立的。
定理 13
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並假設\(T\)的特徵多項式分裂。令\(\lambda\)是\(T\)的特徵值,\(K_\lambda\)為其對應的廣義特徵空間,則\(K_\lambda\)有一個由一些廣義特徵向量的循環的互斥聯集構成的有序基底。
證明:我們對\(\dim K_\lambda=n\)做數學歸納法。
1.
當\(n=1\)時,結論是顯然的。
2.
假設定理對\(\dim K_\lambda=1\sim
n-1\)都成立,則當\(\dim
K_\lambda=n\)時,由定理6第1.點我們知道\(K_\lambda\)是\((T-\lambda I)\)-不變的。令線性映射\(U:K_\lambda\to K_\lambda\)為 \[
U=(T-\lambda I)_{K_\lambda}
\] 則因為\(\{0\}\neq E_\lambda\subseteq
N(U)\),故\(\dim R(U)\neq \dim
K_\lambda\),即應有 \[
\dim R(U)<\dim K_\lambda
\] 考慮\(T\)在\(R(U)\)上的限制\(T_{R(U)}:R(U)\to R(U)\)(易知\(R(U)\)是\((T-\lambda I)\)-不變的,故其也是\(T\)-不變的),可以知道\(R(U)\)是\(T_{R(U)}\)的廣義特徵空間(由\(U\)的定義可知),故根據歸納假設,存在互斥的廣義特徵向量循環\(\gamma_1,\gamma_2,\cdots,\gamma_q\)使得
\[
\gamma=\gamma_1\cup\gamma_2\cup\cdots\gamma_q
\] 是\(R(U)\)的基底。而由\(\gamma_i\subseteq R(U)\)知對於\(i=1\sim q\),存在\(v_i\in K_\lambda\)使得 \[
U(v_i)=\gamma_i\mbox{的末向量}
\] 令 \[
\tilde{\gamma}_i=\gamma_i\cup\{v_i\}=\{\underbrace{w_i}_{\mbox{始向量}},\cdots,\underbrace{v_i}_{\mbox{末向量}}\}
\] 可以發現這會是一個循環。且我們知道\(\{w_1,w_2,\cdots,w_q\}\)是\(E_\lambda\)的線性獨立子集(因為它們是各\(\gamma_i\)的始向量),故我們能把它擴張成\(E_\lambda\)的基底,令其為 \[
\{w_1,w_2,\cdots,w_q,u_1,u_2,\cdots,u_s\}\mbox{ (★)}
\] 則考慮 \[\tilde{\gamma}_1,\tilde{\gamma}_2,\cdots,\tilde{\gamma}_q,u_1,u_2,\cdots,u_s
\] 它們都是廣義特徵向量循環(\(u_1\sim
u_s\)的長度為\(1\)),且它們的始向量的集(即(★))是線性獨立的。由定理12,我們知道
\[
\tilde{\gamma}=\tilde{\gamma}_1\cup\tilde{\gamma}_2\cup\cdots\cup\tilde{\gamma}_q\cup\{u_1,u_2,\cdots,u_s\}
\] 是\(K_\lambda\)的線性獨立子集。我們希望說明\(\tilde{\gamma}\)是\(K_\lambda\)的基底。
令\(\dim R(U)=r\),則 \[
|\tilde{\gamma}|=r+q+s, \dim E_\lambda=q+s=\dim N(U)
\] 則對\(U:K_\lambda\to
K_\lambda\)做維度定理,有 \[
\dim K_\lambda=\dim R(U)+\dim N(U)=r+q+s=|\tilde{\gamma}|
\] 即線性獨立的\(\tilde{\gamma}\)確是\(K_\lambda\)的基底,且其是由一些互斥的循環構成的。
由數學歸納法,可以知道定理對於任何\(\dim
K_\lambda\)都成立。QED
於是,我們就確實證明定理11中的\(\beta\)的存在性了。
約旦典型形式
註記 14
由定理10至定理12,我們可以整理出一個給出線性映射的約旦典型形式的方法:
1. 對於線性映射\(T:V\to
V\),其中\(\dim
V<\infty\)且\(T\)的特徵多項式分裂。令\(T\)的所有特徵值為\(\lambda_1,\lambda_2,\cdots,\lambda_k\),我們可以將\(T\)的約旦典型形式表為 \[
J=[T]^\beta_\beta=\left(
\begin{array}{cccc}
A_1 & & & 0\\
& A_2 & & \\
& & \ddots & \\
0 & & & A_k
\end{array}
\right)
\] 其中\(A_i\)是\((\dim K_{\lambda_i})\times(\dim
K_{\lambda_i})\)的約旦區塊。
2.
由定理10,我們知道我們可以把\(\beta\)分成很多廣義特徵向量的循環的互斥聯集。令\(\beta_i\)為對應特徵值\(\lambda_i\)的循環的聯集,則可以令 \[
\beta_i=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_{n_i}
\] 亦即\(\beta_i\)由\(n_i\)個循環組成。令\(\gamma_j\)的長度為\(p_j\)。我們排序這些循環使得 \[
p_1\geq p_2\geq\cdots\geq p_{n_i}
\] 然後就有對應特徵值\(\lambda_i\)的約旦區塊們了。
例 14-1
對於特徵值\(\lambda_i\),假設\(p_1=3\), \(p_2=3\), \(p_3=2\), \(p_4=1\),則對應\(\lambda_i\)的約旦區塊們為 \[ A_i=\left( \begin{array}{ccccccccc} \lambda_i & 1 & 0 & & & & & & \\ 0 & \lambda_i & 1 & & & & & & \\ 0 & 0 & \lambda_i & & & & & & \\ & & & \lambda_i & 1 & 0 & & & \\ & & & 0 & \lambda_i & 1 & & & \\ & & & 0 & 0 & \lambda_i & & & \\ & & & & & & \lambda_i & 1 & \\ & & & & & & 0 & \lambda_i & \\ & & & & & & & & \lambda_i \end{array} \right) \] 並且我們可以把相應的四個循環寫成下面的樣子: \[ \left\{ \begin{array}{cccc} \textcolor{red}{(T-\lambda_i I)^2(v_1)} & \textcolor{red}{(T-\lambda_i I)^2(v_2)} & \textcolor{red}{(T-\lambda_i I)(v_3)} & \textcolor{red}{v_4}\\ \textcolor{blue}{(T-\lambda_i I)(v_1)} & \textcolor{blue}{(T-\lambda_i I)(v_2)} & \textcolor{blue}{v_3} & \\ v_1 & v_2 & & \end{array} \right\} \] 則可以發現\(\dim K_{\lambda_i}=9\),且這些循環的始向量是 \[ \{(T-\lambda_i I)^2(v_1), (T-\lambda_i I)^2(v_2), (T-\lambda_i I)(v_3), v_4\} \] (上面的紅字),而末向量是\(\{v_1,v_2,v_3,v_4\}\)。故由上面的參考圖知 \[ \begin{aligned} \dim N(T-\lambda_i I)&=\mbox{上面的}\textcolor{red}{\mbox{紅字}}=4\\ \dim N((T-\lambda_i I)^2)&=\mbox{上面的}\textcolor{red}{\mbox{紅字}}+\textcolor{blue}{\mbox{藍字}}=7\\ \dim N((T-\lambda_i I)^3)&=9=\mbox{multi}(\lambda_i)=\dim K_{\lambda_i} \end{aligned} \] (\(\lambda_i\)的重數可以直接從矩陣去計算特徵多項式就能看出來了。)
註記 14-1-1
從這裡可以知道定理7第1.點的小於等於其實就是等於。
註記 15
我們這裡要給出具體找出循環的末向量的方法。以例14-1來說就是要找出\(v_1,v_2,v_3,v_4\)。我們從下往上找,遵循以下步驟:
1. 從\(N((T-\lambda_i
I)^2)\)開始。我們有 \[
\dim N((T-\lambda_i I)^2)=7
\] 我們令\(\beta'\)為\(N((T-\lambda_i I)^2)\)的基底,有\(|\beta'|=7\)。我們把它擴張成\(K_{\lambda_i}\)的基底。即令\(\beta'\cup\{v_1,v_2\}\)是 \[
K_{\lambda_i}=N((T-\lambda_i I)^3)
\] (定理7第2.點)的基底,即要找\(v_1,v_2\)使得 \[
\mbox{span}(\beta'\cup\{v_1,v_2\})=K_{\lambda_i}
\] 且對於所有\(ab\neq 0\)有
\[
v_1,v_2\notin N((T-\lambda_iI)^2), av_1+bv_2\notin N((T-\lambda_iI)^2)
\] 這裡考慮 \[
\alpha=\left\{
\begin{array}{cc}
(T-\lambda_iI)^2(v_1) & (T-\lambda_iI)^2(v_2)\\
(T-\lambda_iI)(v_1) & (T-\lambda_iI)(v_2)\\
v_1 & v_2
\end{array}
\right\}
\] 我們希望說明\((T-\lambda_iI)^2(v_1)\)和\((T-\lambda_iI)^2(v_2)\)是線性獨立的。若不是,則存在\(a,b\)使得 \[
(T-\lambda_iI)^2(av_1+b_v2)=0
\] 而由上面的條件知應有\(a=b=0\),故\((T-\lambda_iI)^2(v_1)\)和\((T-\lambda_iI)^2(v_2)\)應該要是線性獨立的。而由定理12,我們知道\(\alpha\)是線性獨立的。
2. 我們令 \[
\beta''=\{(T-\lambda_iI)^2(v_1), (T-\lambda_iI)^2(v_2), x_1,
x_2\}
\] 是\(N(T-\lambda_iI)\)的基底。考慮集合 \[
\beta''\cup\{(T-\lambda_iI)(v_1), (T-\lambda_iI)(v_2)\}
\] 這個集合的大小是\(6\),故我們可以加一個元素\(v_3\)進去讓 \[
\beta''\cup\{(T-\lambda_iI)(v_1),
(T-\lambda_iI)(v_2)\}\cup\{v_3\}
\] 是\(N((T-\lambda_i
I)^2)\)的基底。則考慮集合 \[
\alpha'=\left\{
\begin{array}{ccc}
(T-\lambda_iI)^2(v_1) & (T-\lambda_iI)^2(v_2) &
(T-\lambda_iI)(v_3)\\
(T-\lambda_iI)(v_1) & (T-\lambda_iI)(v_2) & v_3\\
v_1 & v_2 &
\end{array}
\right\}
\] 和1.中一樣的理由,我們可以知道\(\alpha'\)是線性獨立的。也就是說,其實會有
\[
x_1=(T-\lambda_iI)v_3
\]
3. 用和上述一樣的方法就能求出\(v_4\)了。
例 15-1
考慮矩陣 \[
A=\left(
\begin{array}{cccc}
2 & -1 & 0 & 1\\
0 & 3 & -1 & 0\\
0 & 1 & 1 & 0\\
0 & -1 & 0 & 3
\end{array}
\right)
\] 我們希望求出它的約旦典型形式與對應的約旦典型基底。
1.
首先,我們要求出\(A\)的特徵值。\(A\)的特徵多項式為 \[
\det(A-tI)=(2-t)^3(3-t)
\] 即其特徵值為\(2,3\)。且 \[
\dim K_{\lambda=2}=3, \dim K_{\lambda=3}=1
\] 又我們可以直接計算出 \[
\dim N(A-2I)=2
\] 故\(K_{\lambda=2}\)的基底會形如 \[
\left\{
\begin{array}{cc}
\textcolor{red}{(A-2I)(v_1)} & \textcolor{red}{v_2}\\
\textcolor{blue}{v_1} &
\end{array}
\right\}\mbox{ (✪)}
\] 故知\(A\)的約旦典型形式為
\[
\left(
\begin{array}{cccc}
2 & 1 & & \\
0 & 2 & & \\
& & 2 & \\
& & & 3
\end{array}
\right)
\]
2. 我們接著要求出約旦典型基底。
對於\(\lambda=3\),令其特徵向量為\(\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)\),則 \[
(A-3I)\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)=\left(
\begin{array}{c}
-a-b+d\\
-c\\
b-2c\\
-b
\end{array}
\right)=0
\] 可以取\(b=c=0\), \(a=d=1\),即取特徵向量為\(\left(
\begin{array}{c}
1\\
0\\
0\\
1
\end{array}
\right)\)。
2. 對於\(\lambda=2\),我們要找出\(v_1\)和\(v_2\)。由註記15中的方法知我們要先找出\(v_1\)。令\(\beta'\)是\(N(A-2I)\)的基底,可以知道\(|\beta'|=2\)((✪)中的紅字),我們這裡要先求出\(\beta'\)。考慮特徵向量\(\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)\)滿足 \[
(A-2I)\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)=0
\] 則\(-b+d=0\), \(b-c=0\),有 \[
\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)=t_1\left(
\begin{array}{c}
1\\
0\\
0\\
0
\end{array}
\right)+t_2\textcolor{lime}{\left(
\begin{array}{c}
0\\
1\\
1\\
1
\end{array}
\right)}
\] 而又考慮 \[
(A-2I)^2\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)=0
\] 有\(-2b+c+d=0\),故可以有
\[
\left(
\begin{array}{c}
a\\
b\\
c\\
d
\end{array}
\right)=t_1\left(
\begin{array}{c}
1\\
0\\
0\\
0
\end{array}
\right)+t_2\textcolor{lime}{\left(
\begin{array}{c}
0\\
1\\
0\\
2
\end{array}
\right)}+t_3\textcolor{lime}{\left(
\begin{array}{c}
0\\
0\\
1\\
-1
\end{array}
\right)}
\] 向量\(\left(
\begin{array}{c}
1\\
0\\
0\\
0
\end{array}
\right)\)在上下都有出現,故它應該是\(v_2\)。而淺綠色的三個向量是線性相依的,故我們可以令
\[
v_1=\left(
\begin{array}{c}
0\\
0\\
1\\
-1
\end{array}
\right), (A-2I)(v_1)=\left(
\begin{array}{c}
-1\\
-1\\
-1\\
-1
\end{array}
\right)
\] (這一段需要慢慢參悟,難以言傳。)故可以令約旦基底為 \[
\left\{
(A-2I)(v_1), v_1, v_2, \left(
\begin{array}{c}
1\\
0\\
0\\
1
\end{array}
\right)
\right\}
\] 於是,從\(\mathbb{R}^4\)的標準基底轉換為約旦基底的轉換矩陣就是
\[
\left(
\begin{array}{cccc}
-1 & 0 & 1 & 1\\
-1 & 0 & 0 & 0\\
-1 & 1 & 0 & 0\\
-1 & -1 & 0 & 1
\end{array}
\right)
\]