永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:約旦典型形式

這份筆記是關於矩陣的約旦典型形式的定義與性質,及其存在條件與求法。

廣義特徵空間

定義 1:約旦區塊 (Jordan Block)

我們令約旦區塊為矩陣 \[ \left( \begin{array}{cccccc} \lambda & 1 & & & & 0\\ & \lambda & 1 & & & \\ & & \lambda & 1 & & \\ & & & & \ddots & \\ 0 & & & & & \lambda \end{array} \right) \] 其特徵值為\(\lambda\)

例 1-1

我們底下舉例幾個約旦區塊: \[ \begin{aligned} 2\times 2&:\left( \begin{array}{cc} \lambda & 1\\ 0 & \lambda \end{array} \right)\\ 3\times 3&:\left( \begin{array}{ccc} \lambda & 1 & 0\\ 0 & \lambda & 1\\ 0 & 0 & \lambda \end{array} \right)\\ 4\times 4&:\left( \begin{array}{cccc} \lambda & 1 & 0 & 0\\ 0 & \lambda & 1 & 0\\ 0 & 0 & \lambda & 1\\ 0 & 0 & 0 & \lambda \end{array} \right) \end{aligned} \]

定義 2:約旦典型形式 (Jordan Canonical Form)

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。若有\(V\)的基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} A_1 & & & 0\\ & A_2 & & \\ & & \ddots & \\ 0 & & & A_k \end{array} \right) \] 其中\(A_i\)為約旦區塊,則稱\([T]^\beta_\beta\)\(T\)的約旦典型形式。

例 2-1

考慮矩陣 \[ A=\left( \begin{array}{cccccc} 2 & 1 & 0 & & & 0\\ 0 & 2 & 1 & & & \\ 0 & 0 & 2 & & & \\ & & & 3 & 1 & \\ & & & 0 & 3 & \\ 0 & & & & & 1 \end{array} \right) \] 則由行列式的置換定義(這裡的定理15)可以很容易算出其特徵多項式為\((2-t)^3(3-t)^2(1-t)\)

定義 3:廣義特徵向量 (Generalized Eigenvector)

一個非零向量\(x\in V\)稱為線性映射\(T\)的一個廣義特徵向量(對應特徵值為\(\lambda\)),若存在某個正整數\(p\)使得 \[ (T-\lambda I)^p(x)=0 \]

例 3-1

考慮\(A\)同例2-1,令\(A=[T]^\beta_\beta\),並令\(\beta=\{v_1,v_2,\cdots,v_6\}\)。則有 \[ T(v_1)=2v_1, T(v_2)=v_1+2v_2, T(v_3)=v_2+2v_3 \]\[ \begin{aligned} &(T-2I)(v_1)=0, (T-2I)(v_2)=v_1, (T-2I)(v_3)=v_2\\ \Rightarrow&(T-2I)(v_1)=(T-2I)^2(v_2)=(T-2I)^3(v_3)=0 \end{aligned} \]\(v_1,v_2,v_3\)都是\(T\)的廣義特徵向量,其對應特徵值為\(\lambda=2\)

定義 4:廣義特徵空間 (Generalized Eigenspace)

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。我們稱\(T\)對應特徵值\(\lambda\)的廣義特徵空間\(K_\lambda\)\[ K_\lambda=\{x\in V:(T-\lambda I)^p(x)=0,\mbox{ for some positive integer }p\} \] 我們需要先說明\(K_\lambda\)真的是\(V\)的子空間。

註記 5

對於多項式\(g(t)\)與線性映射\(T:V\to V\),若子空間\(W\)\(T\)-不變的,則\(W\)也是\(g(T)\)-不變的。(這是顯然的)

定理 6

給定線性映射\(T:V\to V\),並令\(\lambda\)\(T\)的特徵值。則
1. \(K_\lambda\)是包含\(E_\lambda\)\(V\)\(T\)-不變子空間。
2. 對於所有\(\mu\neq\lambda\)\(T-\mu I\)\(K_\lambda\)上的限制是一對一的。

證明
1. 很容易可以知道\(0\in K_\lambda\)。而對於所有\(x,y\in K_\lambda\), \(c\in F\),存在\(p,q\)使得 \[ (T-\lambda I)^p(x)=0, (T-\lambda I)^q(cy)=0 \]\[ (T-\lambda I)^{p+q}(x+cy)=(T-\lambda I)^{p+q}(x)+(T-\lambda I)^{p+q}(cy)=0 \]\(x+cy\in K_\lambda\),即\(K_\lambda\)\(V\)的子空間。
而又顯然\(E_\lambda\)是蒐集所有\(p=1\)的廣義特徵向量,故\(E_\lambda\subseteq K_\lambda\)。且若\(x\in K_\lambda\),則\((T-\lambda I)^p(x)=0\),即 \[ (T-\lambda I)^p(T(x))=T(T-\lambda I)^p(x)=0 \] 於是\(T(x)\in K_\lambda\),即\(K_\lambda\)\(T\)-不變的。
2. 給定\(\mu\neq\lambda\),考慮\((T-\mu I)_{K_\lambda}\)的核。給定\(0\neq x\in K_\lambda\)並令 \[ (T-\mu I)(x)=0 \]\(p\)是使\((T-\lambda I)^p(x)=0\)成立的最小整數,即 \[ (T-\lambda I)^p(x)=0, (T-\lambda I)^{p-1}(x)\neq 0 \]\(y=(T-\lambda I)^{p-1}(x)\),則 \[ (T-\lambda I)^p(x)=(T-\lambda I)(y)=0 \]\(y\in E_\lambda\)。而 \[ \begin{aligned} (T-\mu I)(y)&=(T-\mu I)(T-\lambda I)^{p-1}(x)\\ &=(T-\lambda I)^{p-1}\underbrace{(T-\mu I)(x)}_{=0}=0 \end{aligned} \]\(y\in E_\mu\),即\(y\in E_\lambda\cap E_\mu\),即\(y=0\)。這與一開始\(p\)的假設矛盾,故應有 \[ N((T-\mu I)_{K_\lambda})=\{0\} \] 故由這裡的定理9可以知道\((T-\mu I)_{K_\lambda}\)是一對一的。QED

定理 7

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda\)\(T\)的特徵值,並假設\(T\)的特徵多項式分裂。令\(\lambda\)\(T\)的特徵值,其重數為\(m\)。則
1. \(\dim(K_\lambda)\leq m\)
2. \(K_\lambda=N((T-\lambda I)^m)\)

證明
1. 令\(W=K_\lambda\),則由定理6第1.點知\(W\)\(T\)-不變的。令\(h(t)\)\(T_W\)的特徵多項式,並令\(f(t)\)\(T\)的特徵多項式。由這裡的定理4知\(h(t)|f(t)\) (☆)。且由定理6第2.點,我們知道\(\lambda\)\(T_W\)唯一的特徵值(不然如果\(\mu\neq\lambda\)也是\(T_W\)的特徵值的話,\((T-\mu I)_{K_\lambda}\)就不是一對一的了)。故可以寫出 \[ h(t)=(-1)(t-\lambda)^d \] 其中 \[ d=\dim W=\dim K_\lambda \] 故由(☆)可知\(\dim K_\lambda=d\leq m\)
2. 由定義知\(N((T-\lambda I)^m)\subseteq K_\lambda\)。由凱利-漢米爾頓定理(這裡的定理9)知\(h(T_W)=0\),故對於所有\(x\in W\)\[ (T_W-\lambda I)^d(x)=0 \] 又由第1.點知\(d\leq m\),故 \[ W=K_\lambda\subseteq N((T-\lambda I)^m) \] 故有\(K_\lambda=N((T-\lambda I)^m)\)QED

定理 8

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)「所有」的特徵值,並假設\(T\)的特徵多項式分裂。則對於所有\(x\in V_i\),存在\(v_i\in K_{\lambda_i}\)使得 \[ x=v_1+v_2+\cdots+v_k \] 意即 \[ V=K_{\lambda_1}+K_{\lambda_2}+\cdots+K_{\lambda_k} \]

證明:我們對\(k\)做數學歸納法。
1. 當\(k=1\)時,令\(m=\mbox{multi}(\lambda_1)\),則\(T\)的特徵多項式為\((\lambda_1-t)^m\)。由凱利-漢米爾頓定理,我們有\((\lambda_1I-T)^m=0\)。故對於所有\(v\in V\),有 \[ (\lambda_1-t)^m(v)=0 \] 故知\(v\in K_{\lambda_1}\)
2. 假設定理在\(T\)的特徵值個數比\(k\)個少時都成立,則當\(T\)\(k\)個特徵值時,令\(m=\mbox{multi}(\lambda_k)\),則\(T\)的特徵多項式可寫為 \[ f(t)=(t-\lambda_k)^mg(t) \] 其中\((t-\lambda_k)\nmid g(t)\)。令 \[ W=R((T-\lambda_kI)^m) \] 則對於所有\(w\in W\),存在\(w'\in V\)使得\(w=(T-\lambda_kI)^m(w')\)。故 \[ T(w)=T(T=\lambda_kI)^m(w')=(T-\lambda_kI)^m(T(w'))\in W \] 故可知\(W\)\(T\)-不變的。而考慮 \[ (T-\lambda_kI)_{K_{\lambda_i}}:K_{\lambda_i}\to K_{\lambda_i}, i=1\sim k-1 \] (由定理6第1.點,我們知道\(K_{\lambda_i}\)\(T\)-不變的。而由註記5,我們知道它也是\((T-\lambda_kI)\)-不變的)由定理6第2.點,我們知道上述映射是一對一的。而由這裡的性質1-6與這裡的註記2,我們知道\((T-\lambda_kI)_{K_{\lambda_i}}\)是一個同構映射。故 \[ (T-\lambda_kI)(K_{\lambda_i})=K_{\lambda_i} \] 故由定義\(K_{\lambda_i}\subseteq W\)。而由定理6的第1.點,我們有 \[ E_{\lambda_i}\subseteq K_{\lambda_i}\subseteq W, i=1\sim k-1 \] 考慮\(T_W:W\to W\)。由於\(E_{\lambda_i}\subseteq W\),故\(\lambda_i\)\(T_W\)的特徵值, \(\forall i=1\sim k-1\)。我們希望說明\(\lambda_k\)不是\(T_W\)的特徵值。
若有\(0\neq v\in W\)使得\(T(v)=\lambda_kv\),則由定義知存在\(y\in V\)使得 \[ v=(T-\lambda_kI)^m(y) \]\[ 0=(T-\lambda_kI)(v)=(T-\lambda_kI)^{m+1}(y) \]\(y\in K_{\lambda_k}=N((T-\lambda_kI)^m)\)(定理7第2.點)。故 \[ v=(T-\lambda_kI)^m(y)=0 \] 這和\(v\neq 0\)矛盾。故\(\lambda_1,\lambda_2,\cdots,\lambda_{k-1}\)\(T_W\)所有的特徵值,但\(\lambda_k\)不是(之所以知道是「所有的」是因為\(T_W\)的特徵值都應該要是\(T\)的特徵值)。對\(T_W\)用歸納假設,令\(K_{\lambda_i}'\)\(T_W\)\(\lambda_i\)的廣義特徵空間,則對於所有\(x\in V\),存在\(w_i\in K_{\lambda_i}\), \(i=1\sim k-1\)使得 \[ (T-\lambda_kI)^m(x)=w_1+w_2+\cdots+w_{k-1} \] (這裡有\((T-\lambda_kI)^m(x)\in W\),所以可以是用歸納假設。)而由定義知\(K_{\lambda_i}'=K_{\lambda_i}\cap W\)。又\((T-\lambda_kI)_{K_{\lambda_i}}\)是一個同構映射,故存在\(v_i\in K_{\lambda_i}\)使得 \[ (T-\lambda_kI)^m(v_i)=w_i \]\[ (T-\lambda_kI)^m(x)=(T-\lambda_kI)^m(v_1)+\cdots+(T-\lambda_kI)^m(v_{k-1}) \]\(x-v_1-v_2-\cdots-v_{k-1}\in K_{\lambda_k}\)。令 \[ v_k=x-v_1-v_2-\cdots-v_{k-1}\in K_{\lambda_k} \] 則有\(x=v_1+v_2+\cdots+v_k\)。故由數學歸納法知定理對任何\(k\)都成立。QED

定理 9

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)「所有」的特徵值,而\(m_1,m_2,\cdots,m_k\)為它們對應的重數,並假設\(T\)的特徵多項式分裂。令\(\beta_i\)\(K_{\lambda_i}\)的有序基底。則
1. \(\forall i\neq j\), \(\beta_i\cap\beta_j=\varnothing\)
2. \(\beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k\)\(V\)的基底。(由這裡的定理14-1知這與 \[ V=K_{\lambda_1}\oplus K_{\lambda_2}\oplus\cdots\oplus K_{\lambda_k} \] 等價。)
3. \(\dim K_{\lambda_i}=m_i\)

證明
1. 若存在 \[ 0\neq x\in\beta_i\cup\beta_j\subseteq K_{\lambda_i}\cup K_{\lambda_j}, i\neq j \] 則由定理8的推導過程知\((T-\lambda_iI)_{K_{\lambda_i}}\)是同構映射。而\(x\in K_{\lambda_i}\),故知對於所有\(p\)都有 \[ (T-\lambda_iI)^p(x)\neq 0 \] 然而這導致\(x\notin K_{\lambda_i}\),矛盾。故\(\forall i\neq j\), \(\beta_i\cap\beta_j=\varnothing\)
2. 對於所有\(x\in V\),由定理8知存在\(v_i\in K_{\lambda_i}\)使得 \[ x=v_1+v_2+\cdots+v_k \]\(x\in\mbox{span}(\beta_1\cup\beta_2\cup\cdots\cup\beta_k)\)。故有 \[ V=\mbox{span}(\beta_1\cup\beta_2\cup\cdots\cup\beta_k) \]\(|\beta_i|=\dim K_{\lambda_i}\leq m_i\)(定理7第1.點),故 \[ \dim V\leq\sum_{i=1}^k|\beta_i|\leq\sum_{i=1}^k m_i=\dim V \] (最後的等於是因為\(T\)的特徵多項式分裂)故中間都是等號,即 \[ \dim V=\sum_{i=1}^k|\beta_i| \]\(\beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k\)確是\(V\)的基底。
3. 由第2.點的推導過程直接可得\(|\beta_i|=\dim K_{\lambda_i}=m_i\)QED

循環

定義 10:循環 (Cycle)

給定線性映射\(T:V\to V\),其中\(0\neq x\)\(T\)的廣義特徵向量,其對應的特徵值為\(\lambda\)。又令\(p\)是使\((T-\lambda I)^p(x)=0\)的最小整數。則令 \[ \{(T-\lambda I)^{p-1}(x),\cdots,(T-\lambda I)(x),x\} \]\(T\)對應特徵值\(\lambda\)的廣義特徵向量循環。

定義 10-1:始向量 (Initial Vector)

我們稱定義10中的\((T-\lambda I)^{p-1}(x)\)為始向量。

定義 10-2:末向量 (End Vector)

我們稱定義10中的\(x\)為末向量。

定理 11

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並假設\(T\)的特徵多項式分裂。如果\(V\)存在基底\(\beta\)使得\(\beta\)\(T\)的廣義特徵向量的循環的互斥聯集,則
1. 對於任意\(\beta\)中的循環\(\gamma\)\(W=\mbox{span}(\gamma)\)\(T\)-不變的,且\([T_W]^\gamma_\gamma\)是一個約旦區塊。
2. \(\beta\)是使\(T\)能表示成約旦典型形式的基底。

定義 11-1:互斥聯集 (Disjoint Union)

即許多兩兩交集為空的集合的聯集。

定義 11-2:約旦典型基底 (Jordan Canonical Basis)

一般稱定理11第2.點中的\(\beta\)\(T\)的約旦典型基底。

證明
1. 令\(\gamma\)的長度為\(p\)(即令\(|\gamma|=p\)),末向量為\(x\),對應的特徵值為\(\lambda\),則 \[ \gamma=\{\underbrace{v_1}_{(T-\lambda I)^{p-1}(x)},\cdots,\underbrace{v_p}_{x}\} \] 而對於所有\(i>1\),有\((T-\lambda I)(v_i)=v_{i-1}\),故 \[ T(v_i)=v_{i-1}+\lambda v_i\in W \]\(i=1\)時亦有\(T(v_1)=\lambda v_1\in W\),故可知\(W\)\(T\)-不變的。而由\(T(v_i)=v_{i-1}+\lambda v_i\)\[ [T_W]^\gamma_\gamma=\left( \begin{array}{cccc} \lambda & 1 & & 0\\ & \lambda & 1 & \\ & & \lambda & \\ 0 & & & \ddots \end{array} \right) \] 可以發現\([T_W]^\gamma_\gamma\)確實是約旦區塊。
2. 由\(\gamma\)之間彼此互斥就顯然可得了。QED

接著,我們要來說明定理11中那種\(\beta\)的存在性。

定理 12

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並令\(\lambda\)\(T\)的特徵值。令\(\gamma_1,\gamma_2,\cdots,\gamma_q\)為與\(\lambda\)相對應的廣義特徵向量循環,且\(\gamma_i\)的始向量們構成一個線性獨立的集合,則\(\gamma_i\)是互斥的,且 \[ \gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_q \] 是線性獨立的。

證明:我們分兩部分證明。
1. 我們希望說明\(\gamma_i\)是互斥的。若不然,則令 \[ (T-\lambda I)^{n_i}(x_i)=(T-\lambda I)^{n_j}(x_j) \] 其中\(x_i,x_j\)\(\lambda\)的相異廣義特徵向量。即 \[ (T-\lambda I)^{n_i}(x_i)\in\gamma_i, (T-\lambda I)^{n_j}(x_j)\in\gamma_j \]\(l_i,l_j\)\(\gamma_i,\gamma_j\)的長度。則比較\(l_i-n_i\)\(l_j-n_j\)。假設\(l_j-n_j<l_i-n_i\),則 \[ (T-\lambda I)^{l_j-n_j}(T-\lambda I)^{n_i}(x_i)=(T-\lambda I)^{l_j-n_j}(T-\lambda I)^{n_j}(x_j)=(T-\lambda I)^{l_j}(x_j)=0 \]\(\tilde{n_i}=l_j-n_j+n_i\),則 \[ \tilde{n_i}<l_i-n_i+n_i<l_i \]\((T-\lambda I)^{\tilde{n_i}}(x_i)=0\)。可以發現這裡矛盾了,故應有\(l_i-n_i=l_j-n_j\)
然而,當\(l_i-n_i=l_j-n_j\)時,有 \[ \underbrace{(T-\lambda I)^{l_i-1}(x_i)}_{\gamma_i\mbox{的始向量}}=\underbrace{(T-\lambda I)^{l_j-1}(x_i)}_{\gamma_j\mbox{的始向量}} \] 這和\(\gamma_i\)的始向量們線性獨立的假設矛盾。故\(\gamma_i\)之間應該是互斥的。
2. 我們希望說明\(\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_q\)是線性獨立的。我們對\(\gamma\)中的向量數\(N\)做數學歸納法。當\(N=1\)時,結論是顯然的。假設\(N=1,2,\cdots,n-1\)時定理成立,令\(|\gamma|=n\),並令\(W=\mbox{span}(\gamma)\)。由定理11第1.點可知\(W\)\((T-\lambda I)\)-不變的,且\(\dim W\leq n\)。考慮線性映射\(U=(T-\lambda I)_W:W\to W\)。則對於\(i=1,2,\cdots,q\),令 \[ \gamma_i'=\gamma_i-\{\gamma_i\mbox{的末向量}\} \] (上面的減號是指差集)。則有 \[ \gamma_i=\{x,\underbrace{(T-\lambda I)(x),(T-\lambda I)^2(x),\cdots,(T-\lambda I)^{l-1}(x)}_{\gamma_i'}\}\supseteq\gamma_i' \] 故可以發現每個\(\gamma_i'\)中的向量都是某個\(\gamma_i\)中的向量在\(U\)下的像 i.e. \(\forall v\in\gamma_i'\),存在\(w\in\gamma_i\)使得\(U(w)=v\)。令 \[ \gamma'=\gamma_1'\cup\gamma_2'\cup\gamma_3'\cup\cdots\cup\gamma_q', |\gamma'|<n \] 由歸納假設,我們知道\(\gamma'\)是線性獨立的。
接著,我們知道\(U(\gamma)=\gamma'\)(其實會有幾項\(\gamma\)的元素\(v\)導致\(U(v)=0\)(即各循環的始向量),但我們先略過它們。)由定義知\(U\)的定義域是\(W=\mbox{span}(\gamma)\),故可知\(\gamma'\)\(R(U)\)的基底,即\(\dim R(U)=n-q\)。而又因為\(N(U)\)中有\(q\)個線性獨立的始向量\((T-\lambda I)^{l_i-1}(x_i)\)(這裡有 \[ (T-\lambda I)(T-\lambda I)^{l_i-1}(x_i)=(T-\lambda I)^{l_i}(x_i)=0 \] 故有\((T-\lambda I)^{l_i-1}(x_i)\in N(U)\)。),故\(\dim N(U)\geq q\)。故 \[ n\geq \dim W=\dim R(U)+\dim N(U)\geq (n-q)+q=n \] 故中間每一個大於等於其實都是等於,即\(\dim W=\dim(\mbox{span}(\gamma))=n\) i.e. \(\gamma\)是線性獨立的。
由數學歸納法,我們可以知道\(\gamma=\gamma_1\cup\cdots\cup\gamma_q\)總是線性獨立的。QED

註記 12-1

由定理12可知所有廣義特徵向量的循環都是線性獨立的。

定理 13

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並假設\(T\)的特徵多項式分裂。令\(\lambda\)\(T\)的特徵值,\(K_\lambda\)為其對應的廣義特徵空間,則\(K_\lambda\)有一個由一些廣義特徵向量的循環的互斥聯集構成的有序基底。

證明:我們對\(\dim K_\lambda=n\)做數學歸納法。
1. 當\(n=1\)時,結論是顯然的。
2. 假設定理對\(\dim K_\lambda=1\sim n-1\)都成立,則當\(\dim K_\lambda=n\)時,由定理6第1.點我們知道\(K_\lambda\)\((T-\lambda I)\)-不變的。令線性映射\(U:K_\lambda\to K_\lambda\)\[ U=(T-\lambda I)_{K_\lambda} \] 則因為\(\{0\}\neq E_\lambda\subseteq N(U)\),故\(\dim R(U)\neq \dim K_\lambda\),即應有 \[ \dim R(U)<\dim K_\lambda \] 考慮\(T\)\(R(U)\)上的限制\(T_{R(U)}:R(U)\to R(U)\)(易知\(R(U)\)\((T-\lambda I)\)-不變的,故其也是\(T\)-不變的),可以知道\(R(U)\)\(T_{R(U)}\)的廣義特徵空間(由\(U\)的定義可知),故根據歸納假設,存在互斥的廣義特徵向量循環\(\gamma_1,\gamma_2,\cdots,\gamma_q\)使得 \[ \gamma=\gamma_1\cup\gamma_2\cup\cdots\gamma_q \]\(R(U)\)的基底。而由\(\gamma_i\subseteq R(U)\)知對於\(i=1\sim q\),存在\(v_i\in K_\lambda\)使得 \[ U(v_i)=\gamma_i\mbox{的末向量} \]\[ \tilde{\gamma}_i=\gamma_i\cup\{v_i\}=\{\underbrace{w_i}_{\mbox{始向量}},\cdots,\underbrace{v_i}_{\mbox{末向量}}\} \] 可以發現這會是一個循環。且我們知道\(\{w_1,w_2,\cdots,w_q\}\)\(E_\lambda\)的線性獨立子集(因為它們是各\(\gamma_i\)的始向量),故我們能把它擴張成\(E_\lambda\)的基底,令其為 \[ \{w_1,w_2,\cdots,w_q,u_1,u_2,\cdots,u_s\}\mbox{ (★)} \] 則考慮 \[\tilde{\gamma}_1,\tilde{\gamma}_2,\cdots,\tilde{\gamma}_q,u_1,u_2,\cdots,u_s \] 它們都是廣義特徵向量循環(\(u_1\sim u_s\)的長度為\(1\)),且它們的始向量的集(即(★))是線性獨立的。由定理12,我們知道 \[ \tilde{\gamma}=\tilde{\gamma}_1\cup\tilde{\gamma}_2\cup\cdots\cup\tilde{\gamma}_q\cup\{u_1,u_2,\cdots,u_s\} \]\(K_\lambda\)的線性獨立子集。我們希望說明\(\tilde{\gamma}\)\(K_\lambda\)的基底。
\(\dim R(U)=r\),則 \[ |\tilde{\gamma}|=r+q+s, \dim E_\lambda=q+s=\dim N(U) \] 則對\(U:K_\lambda\to K_\lambda\)做維度定理,有 \[ \dim K_\lambda=\dim R(U)+\dim N(U)=r+q+s=|\tilde{\gamma}| \] 即線性獨立的\(\tilde{\gamma}\)確是\(K_\lambda\)的基底,且其是由一些互斥的循環構成的。
由數學歸納法,可以知道定理對於任何\(\dim K_\lambda\)都成立。QED

於是,我們就確實證明定理11中的\(\beta\)的存在性了。

約旦典型形式

註記 14

由定理10至定理12,我們可以整理出一個給出線性映射的約旦典型形式的方法:
1. 對於線性映射\(T:V\to V\),其中\(\dim V<\infty\)\(T\)的特徵多項式分裂。令\(T\)的所有特徵值為\(\lambda_1,\lambda_2,\cdots,\lambda_k\),我們可以將\(T\)的約旦典型形式表為 \[ J=[T]^\beta_\beta=\left( \begin{array}{cccc} A_1 & & & 0\\ & A_2 & & \\ & & \ddots & \\ 0 & & & A_k \end{array} \right) \] 其中\(A_i\)\((\dim K_{\lambda_i})\times(\dim K_{\lambda_i})\)的約旦區塊。
2. 由定理10,我們知道我們可以把\(\beta\)分成很多廣義特徵向量的循環的互斥聯集。令\(\beta_i\)為對應特徵值\(\lambda_i\)的循環的聯集,則可以令 \[ \beta_i=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_{n_i} \] 亦即\(\beta_i\)\(n_i\)個循環組成。令\(\gamma_j\)的長度為\(p_j\)。我們排序這些循環使得 \[ p_1\geq p_2\geq\cdots\geq p_{n_i} \] 然後就有對應特徵值\(\lambda_i\)的約旦區塊們了。

例 14-1

對於特徵值\(\lambda_i\),假設\(p_1=3\), \(p_2=3\), \(p_3=2\), \(p_4=1\),則對應\(\lambda_i\)的約旦區塊們為 \[ A_i=\left( \begin{array}{ccccccccc} \lambda_i & 1 & 0 & & & & & & \\ 0 & \lambda_i & 1 & & & & & & \\ 0 & 0 & \lambda_i & & & & & & \\ & & & \lambda_i & 1 & 0 & & & \\ & & & 0 & \lambda_i & 1 & & & \\ & & & 0 & 0 & \lambda_i & & & \\ & & & & & & \lambda_i & 1 & \\ & & & & & & 0 & \lambda_i & \\ & & & & & & & & \lambda_i \end{array} \right) \] 並且我們可以把相應的四個循環寫成下面的樣子: \[ \left\{ \begin{array}{cccc} \textcolor{red}{(T-\lambda_i I)^2(v_1)} & \textcolor{red}{(T-\lambda_i I)^2(v_2)} & \textcolor{red}{(T-\lambda_i I)(v_3)} & \textcolor{red}{v_4}\\ \textcolor{blue}{(T-\lambda_i I)(v_1)} & \textcolor{blue}{(T-\lambda_i I)(v_2)} & \textcolor{blue}{v_3} & \\ v_1 & v_2 & & \end{array} \right\} \] 則可以發現\(\dim K_{\lambda_i}=9\),且這些循環的始向量是 \[ \{(T-\lambda_i I)^2(v_1), (T-\lambda_i I)^2(v_2), (T-\lambda_i I)(v_3), v_4\} \] (上面的紅字),而末向量是\(\{v_1,v_2,v_3,v_4\}\)。故由上面的參考圖知 \[ \begin{aligned} \dim N(T-\lambda_i I)&=\mbox{上面的}\textcolor{red}{\mbox{紅字}}=4\\ \dim N((T-\lambda_i I)^2)&=\mbox{上面的}\textcolor{red}{\mbox{紅字}}+\textcolor{blue}{\mbox{藍字}}=7\\ \dim N((T-\lambda_i I)^3)&=9=\mbox{multi}(\lambda_i)=\dim K_{\lambda_i} \end{aligned} \] (\(\lambda_i\)的重數可以直接從矩陣去計算特徵多項式就能看出來了。)

註記 14-1-1

從這裡可以知道定理7第1.點的小於等於其實就是等於。

註記 15

我們這裡要給出具體找出循環的末向量的方法。以例14-1來說就是要找出\(v_1,v_2,v_3,v_4\)。我們從下往上找,遵循以下步驟:
1. 從\(N((T-\lambda_i I)^2)\)開始。我們有 \[ \dim N((T-\lambda_i I)^2)=7 \] 我們令\(\beta'\)\(N((T-\lambda_i I)^2)\)的基底,有\(|\beta'|=7\)。我們把它擴張成\(K_{\lambda_i}\)的基底。即令\(\beta'\cup\{v_1,v_2\}\)\[ K_{\lambda_i}=N((T-\lambda_i I)^3) \] (定理7第2.點)的基底,即要找\(v_1,v_2\)使得 \[ \mbox{span}(\beta'\cup\{v_1,v_2\})=K_{\lambda_i} \] 且對於所有\(ab\neq 0\)\[ v_1,v_2\notin N((T-\lambda_iI)^2), av_1+bv_2\notin N((T-\lambda_iI)^2) \] 這裡考慮 \[ \alpha=\left\{ \begin{array}{cc} (T-\lambda_iI)^2(v_1) & (T-\lambda_iI)^2(v_2)\\ (T-\lambda_iI)(v_1) & (T-\lambda_iI)(v_2)\\ v_1 & v_2 \end{array} \right\} \] 我們希望說明\((T-\lambda_iI)^2(v_1)\)\((T-\lambda_iI)^2(v_2)\)是線性獨立的。若不是,則存在\(a,b\)使得 \[ (T-\lambda_iI)^2(av_1+b_v2)=0 \] 而由上面的條件知應有\(a=b=0\),故\((T-\lambda_iI)^2(v_1)\)\((T-\lambda_iI)^2(v_2)\)應該要是線性獨立的。而由定理12,我們知道\(\alpha\)是線性獨立的。
2. 我們令 \[ \beta''=\{(T-\lambda_iI)^2(v_1), (T-\lambda_iI)^2(v_2), x_1, x_2\} \]\(N(T-\lambda_iI)\)的基底。考慮集合 \[ \beta''\cup\{(T-\lambda_iI)(v_1), (T-\lambda_iI)(v_2)\} \] 這個集合的大小是\(6\),故我們可以加一個元素\(v_3\)進去讓 \[ \beta''\cup\{(T-\lambda_iI)(v_1), (T-\lambda_iI)(v_2)\}\cup\{v_3\} \]\(N((T-\lambda_i I)^2)\)的基底。則考慮集合 \[ \alpha'=\left\{ \begin{array}{ccc} (T-\lambda_iI)^2(v_1) & (T-\lambda_iI)^2(v_2) & (T-\lambda_iI)(v_3)\\ (T-\lambda_iI)(v_1) & (T-\lambda_iI)(v_2) & v_3\\ v_1 & v_2 & \end{array} \right\} \] 和1.中一樣的理由,我們可以知道\(\alpha'\)是線性獨立的。也就是說,其實會有 \[ x_1=(T-\lambda_iI)v_3 \]
3. 用和上述一樣的方法就能求出\(v_4\)了。

例 15-1

考慮矩陣 \[ A=\left( \begin{array}{cccc} 2 & -1 & 0 & 1\\ 0 & 3 & -1 & 0\\ 0 & 1 & 1 & 0\\ 0 & -1 & 0 & 3 \end{array} \right) \] 我們希望求出它的約旦典型形式與對應的約旦典型基底。
1. 首先,我們要求出\(A\)的特徵值。\(A\)的特徵多項式為 \[ \det(A-tI)=(2-t)^3(3-t) \] 即其特徵值為\(2,3\)。且 \[ \dim K_{\lambda=2}=3, \dim K_{\lambda=3}=1 \] 又我們可以直接計算出 \[ \dim N(A-2I)=2 \]\(K_{\lambda=2}\)的基底會形如 \[ \left\{ \begin{array}{cc} \textcolor{red}{(A-2I)(v_1)} & \textcolor{red}{v_2}\\ \textcolor{blue}{v_1} & \end{array} \right\}\mbox{ (✪)} \] 故知\(A\)的約旦典型形式為 \[ \left( \begin{array}{cccc} 2 & 1 & & \\ 0 & 2 & & \\ & & 2 & \\ & & & 3 \end{array} \right) \]
2. 我們接著要求出約旦典型基底。
對於\(\lambda=3\),令其特徵向量為\(\left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)\),則 \[ (A-3I)\left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)=\left( \begin{array}{c} -a-b+d\\ -c\\ b-2c\\ -b \end{array} \right)=0 \] 可以取\(b=c=0\), \(a=d=1\),即取特徵向量為\(\left( \begin{array}{c} 1\\ 0\\ 0\\ 1 \end{array} \right)\)
2. 對於\(\lambda=2\),我們要找出\(v_1\)\(v_2\)。由註記15中的方法知我們要先找出\(v_1\)。令\(\beta'\)\(N(A-2I)\)的基底,可以知道\(|\beta'|=2\)((✪)中的紅字),我們這裡要先求出\(\beta'\)。考慮特徵向量\(\left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)\)滿足 \[ (A-2I)\left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)=0 \]\(-b+d=0\), \(b-c=0\),有 \[ \left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)=t_1\left( \begin{array}{c} 1\\ 0\\ 0\\ 0 \end{array} \right)+t_2\textcolor{lime}{\left( \begin{array}{c} 0\\ 1\\ 1\\ 1 \end{array} \right)} \] 而又考慮 \[ (A-2I)^2\left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)=0 \]\(-2b+c+d=0\),故可以有 \[ \left( \begin{array}{c} a\\ b\\ c\\ d \end{array} \right)=t_1\left( \begin{array}{c} 1\\ 0\\ 0\\ 0 \end{array} \right)+t_2\textcolor{lime}{\left( \begin{array}{c} 0\\ 1\\ 0\\ 2 \end{array} \right)}+t_3\textcolor{lime}{\left( \begin{array}{c} 0\\ 0\\ 1\\ -1 \end{array} \right)} \] 向量\(\left( \begin{array}{c} 1\\ 0\\ 0\\ 0 \end{array} \right)\)在上下都有出現,故它應該是\(v_2\)。而淺綠色的三個向量是線性相依的,故我們可以令 \[ v_1=\left( \begin{array}{c} 0\\ 0\\ 1\\ -1 \end{array} \right), (A-2I)(v_1)=\left( \begin{array}{c} -1\\ -1\\ -1\\ -1 \end{array} \right) \] (這一段需要慢慢參悟,難以言傳。)故可以令約旦基底為 \[ \left\{ (A-2I)(v_1), v_1, v_2, \left( \begin{array}{c} 1\\ 0\\ 0\\ 1 \end{array} \right) \right\} \] 於是,從\(\mathbb{R}^4\)的標準基底轉換為約旦基底的轉換矩陣就是 \[ \left( \begin{array}{cccc} -1 & 0 & 1 & 1\\ -1 & 0 & 0 & 0\\ -1 & 1 & 0 & 0\\ -1 & -1 & 0 & 1 \end{array} \right) \]