永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:特徵值與對角化

這份筆記是關於矩陣可對角化的條件。

特徵值、特徵向量與特徵多項式

定義 1:對角化 (Diagonalization)

考慮線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則我們稱\(T\)是可對角化的,若存在\(V\)的有序基底\(\beta\)使得\([T]_\beta\)是對角矩陣。而對於矩陣\(A\in M_{n\times n}(F)\)。我們稱\(A\)可對角化,若\(L_A\)可對角化。

定義 2:特徵值與特徵向量 (Eigenvalue and Eigenvector)

給定可對角化的線性映射\(T:V\to V\),則存在\(V\)的基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right) \]\(\beta=\{v_1,v_2,\cdots,v_n\}\)則有 \[ T(v_i)=\lambda_iv_i \] 則我們將使\(T(v)=\lambda v\)\(\lambda\)稱為\(T\)的特徵值,並將\(v\neq 0\)稱為特徵向量。而矩陣\(A\in M_{n\times n}(F)\)的特徵值與特徵向量即定義為\(L_A\)的特徵值與特徵向量。

定理 3

給定\(A\in M_{n\times n}(F)\),則\(\lambda\in F\)\(A\)的特徵值 iff. \[ \det(A-\lambda I_n) \]

證明:我們知道\(\lambda\in F\)\(A\)的特徵值\(\Leftrightarrow\)存在\(0\neq v\in F^n\)使得\(Av=\lambda v\) i.e. \[ (A-\lambda I_n)(v)=0 \] \(\Leftrightarrow N(A-\lambda I_n)\neq\{0\}\Leftrightarrow\det(A-\lambda I_n)=0\)QED

定義 4:特徵多項式 (Characteristic Polynomial)

給定\(A\in M_{n\times n}(F)\),我們稱\(f(t)=\det(A-tI_n)\)\(A\)的特徵多項式。而對於線性映射\(T:V\to V\),我們將其特徵多項式定義為\([T]^\beta_\beta\)的特徵多項式,其中\(\beta\)\(V\)的意一組有序基底。

註記 4-1

由定理3可以知道\(\lambda\)\(A\)的特徵值 iff. \(\lambda\)\(A\)的特徵多項式的根。

註記 4-2

定義4中線性映射\(T:V\to V\)的特徵多項式與基底\(\beta\)的選取無關。

證明:令\(\beta,\beta'\)\(V\)的有序基底,則由這裡的定理3知 \[ [T]^{\beta'}_{\beta'}=[I]_\beta^{\beta'}[T]^\beta_\beta[I]^\beta_{\beta'} \]\(Q=[I]^\beta_{\beta'}\), \(Q^{-1}=[I]^\beta_{\beta'}\)。則 \[ \begin{aligned} \det\left([T]^{\beta'}_{\beta'}-tI_n\right)&=\det\left([I]_\beta^{\beta'}[T]^\beta_\beta[I]^\beta_{\beta'}-tI_n\right)\\ &=\det(Q^{-1})\det\left([T]^\beta_\beta-tI_n\right)\det(Q)\;\;(Q^{-1}I_nQ=I_n)\\ &=\det\left([T]^\beta_\beta-tI_n\right) \end{aligned} \] 於是知\(T\)的特徵多項式與\(\beta\)的選取無關。QED

註記 4-3

給定\(A\in M_{n\times n}(F)\),則其特徵多項式為\(n\)次多項式,\(t^n\)項係數為\((-1)^n\)。(這是顯然的)

註記 4-4

給定\(A\in M_{n\times n}(F)\),由註記4-3知在\(\mathbb{C}\)\(A\)的特徵值至多只有\(n\)個。

註記 4-5

給定線性映射\(T:V\to V\),令\(\lambda\)為其特徵值,\(v\)\(\lambda\)對應的特徵向量,則\(v\in N(T-\lambda I)\)

註記 4-6

給定\(A\in M_{n\times n}(F)\),並令\(\beta\)是由\(A\)的特徵向量構成的\(F^n\)的基底(假設這樣的基底存在),並令\(\beta'\)\(F^n\)的標準基底,又令\(Q=[I]^{\beta'}_\beta\),則\(Q^{-1}AQ\)是對角矩陣。

證明:由這裡的定理3,我們有 \[ [L_A]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right)=[I_V]^\beta_{\beta'}[L_A]^{\beta'}_{\beta'}[I_V]_\beta^{\beta'}=Q^{-1}AQ \] QED

定理 5

給定線性映射\(T:V\to V\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)的相異的特徵值,其對應到的特徵向量分別為\(v_1,v_2,\cdots,v_k\),則\(\{v_1,\cdots,v_k\}\)是線性獨立的。

證明:我們使用數學歸納法來證明。
1. \(k=1\)時,結論是顯然的。
2. 假設命題對\(1,2,\cdots,k-1\)都成立,則若 \[ a_1v_1+a_2v_2+\cdots+a_kv_k=0\mbox{ (☆)} \] 我們對上式使用線性映射\((T-\lambda_kI)\),則 \[ a_1(\lambda_1-\lambda_k)v_1+a_2(\lambda-\lambda_k)v_2+\cdots+a_{k-1}(\lambda_{k-1}-\lambda_k)v_{k-1}+0=0 \] 由歸納假設,\(\{v_1,\cdots,v_{k-1}\}\)是線性獨立的,故必須有 \[ a_1(\lambda_1-\lambda_k)v_1=a_2(\lambda-\lambda_k)v_2=\cdots=a_{k-1}(\lambda_{k-1}-\lambda_k)v_{k-1}=0 \] 然而\(\lambda_i\)兩兩不同,故 \[ a_1=a_2=\cdots=a_{k-1}=0 \] 代回(☆),有\(a_k=0\),故\(\{v_1,\cdots,v_k\}\)線性獨立。
由數學歸納法可知定理成立。QED

註記 5-1

給定線性映射\(T:V\to V\),其中\(\dim V=n\)。則若\(T\)\(n\)個不同的特徵值,則\(T\)\(n\)個線性獨立的特徵向量,即\(T\)可對角化。

定義 6:分裂 (Split)

\(f(t)\)是係數都在\(F\)中的多項式,我們說\(f\)\(F\)上分裂,若存在\(c,a_1,a_2,\cdots,a_n\in F\)使得 \[ f(t)=c(t-a_1)(t-a_2)\cdots(t-a_n) \]

定理 7

可對角化線性映射的特徵多項式在\(F\)上分裂。

證明:給定線性映射\(T:V\to V\),由於\(T\)可對角化,故存在\(V\)的有序基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right) \]\(T\)的特徵多項式為 \[ \det\left( \begin{array}{cccc} \lambda_1-t & & & 0\\ & \lambda_2-t & & \\ & & \ddots & \\ 0 & & & \lambda_n-t \end{array} \right)=(\lambda_1-t)(\lambda_2-t)\cdots(\lambda_n-t) \] QED

特徵空間

定義 8:重數 (Multiplicity)

給定線性映射\(T:V\to V\)並給定其特徵值\(\lambda\),並令其特徵多項式為\(f(t)\)。若我們能把\(f(t)\)表為 \[ f(t)=(t-\lambda)^kg(t) \] 其中\(g(\lambda)\neq 0\),則稱\(\lambda\)的重數為\(k\),記做 \[ \mbox{multi}(\lambda)=k \]

定義 9:特徵空間 (Eigenspace)

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的特徵值\(\lambda\)。則我們定義\(T\)對應\(\lambda\)的特徵空間為 \[ E_\lambda=\{x\in V:T(x)=\lambda x\}=N(T-\lambda I)\subseteq V \]

定理 10

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的特徵值\(\lambda\)。若\(\mbox{multi}(\lambda)=m\),則\(1\leq\dim(E_\lambda)\leq m\)

證明:令\(\dim(E_\lambda)=p\),並令\(\{v_1,v_2,\cdots,v_p\}\)\(E_\lambda\)的有序基底。使用取代定理(這裡的定理5)可以把\(\{v_1,v_2,\cdots,v_p\}\)擴展成\(V\)的基底,即 \[ \beta=\{v_1,v_2,\cdots,v_p,v_{p+1},\cdots,v_n\} \]\[ [T]^\beta_\beta=\left( \begin{array}{c|c} \lambda I_p & B\\ \hline O & C \end{array} \right) \] 其中\(O\)為零矩陣。令\(A=[T]^\beta_\beta\),則 \[ \begin{aligned} T\mbox{的特徵多項式}&=\det(A-tI_n)\\ &=\det\left( \begin{array}{c|c} (\lambda-t)I_p & B\\ \hline O & C-tI \end{array} \right)\\ &=\det((\lambda-t)I_p)\det(C-tI)\\ &\mbox{(這裡略過了一些有點恐怖的計算)}\\ &=(\lambda-tI)^p h(t) \end{aligned} \] 而由定義知\(p\leq m\),即 \[ 1\leq\dim(E_\lambda)\leq m \] QED

引理 11

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。任選\(v_i\in E_{\lambda_i}\),若 \[ v_1+v_2+\cdots+v_k=0 \]\(v_i=0\), \(\forall i=1\sim k\)

證明:不是的話就和定理5矛盾了。QED

定理 12

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。並令\(S_i\)\(E_{\lambda_i}\)的一個有限線性獨立子集,則 \[ S=S_1\cup S_2\cup\cdots\cup S_k \]\(V\)的線性獨立子集。

證明:令\(|S_i|=n_i\),且 \[ S_i=\{v_{i1},v_{i2},\cdots,v_{in_i}\} \] 則若 \[ \mathop{\sum}_{1\leq i\leq k\atop 1\leq j\leq n_i}a_{ij}v_{ij}=0 \] 則令 \[ w_i=\sum_{j=1}^{n_i}a_{ij}v_{ij}\in E_{\lambda_i} \]\[ \sum_{i=1}^k w_i=0 \] 由引理11,有\(w_i=0\),故\(a_{ij}=0\),即\(S\)是線性獨立的。QED

可對角化的條件

定理 13

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。並假設\(T\)的特徵多項式在\(F\)上分裂。則\(T\)可對角化 iff. \(\mbox{multi}(\lambda_i)=\dim(E_{\lambda_i})\), \(\forall i=1\sim k\)

證明:令\(\mbox{multi}(\lambda_i)=m_i\), \(\dim(E_{\lambda_i})=d_i\), \(\dim V=n\)。則由定理10,我們知道\(1\leq d_i\leq m_i\)
\(\Rightarrow\)」:若\(T\)可對角化,則存在\(V\)的有序基底\(\beta\)使得\([T]^\beta_\beta\)是對角矩陣,其中\(\beta\)的元素為\(T\)的特徵向量。令 \[ \beta_i=\beta\cap E_{\lambda_i}, |\beta_i|=n_i, |\beta|=n \]\[ n_i\leq d_i\leq m_i, \sum_{i=1}^k n_i=n, \sum_{i=1}^k m_i=n \] (最後一條是因為\(T\)的特徵多項式在\(F\)上分裂),故對所有\(i\)應有\(n_i=m_i\),即對所有\(i\)\(d_i=m_i\)。故有 \[ \mbox{multi}(\lambda_i)=\dim(E_{\lambda_i}) \]
\(\Leftarrow\)」:若對於所有\(i\)\(m_i=d_i\),則令\(\beta_i\)\(E_{\lambda_i}\)的有序基底,則 \[ |\beta_i|=\dim(E_{\lambda_i})=d_i \]\[ \beta=\beta\cup\beta_2\cup\cdots\cup\beta_k \] 由定理12,我們知道\(\beta\)是線性獨立的,而 \[ |\beta|=\sum_{i=1}^k|\beta_i|=\sum_{i=1}^k d_i=\sum_{i=1}^k m_i=n \]\(\beta\)\(V\)的有序基底,且\(\beta\)的元素為\(T\)的特徵向量,故知\(T\)是可對角化的。QED

定理 13-1

沿用定理13的符號。若\(T\)可對角化且\(\beta_i\)\(E_{\lambda_i}\)的有序基底,則 \[ \beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k \]\(V\)的有序基底,且\([T]^\beta_\beta\)為對角矩陣。

註記 13-2

定理13中可對角化的條件可以等價為 \[ \begin{aligned} \mbox{multi}(\lambda_i)&=\dim(E_{\lambda_i})\\ &=\dim N(T-\lambda_i I)\\ &=n-\mbox{rank}(T-\lambda_i I) \end{aligned} \]

定義 14:直和 (Direct Sum)

給定向量空間\(V\)的子空間\(W_1,W_2,\cdots,W_k\)。我們令 \[ W_1+W_2+\cdots+W_k=\{v_1+v_2+\cdots+v_k:v_i\in W_i\} \]\(V=W_1+W_2+\cdots+W_k\)且對於所有\(j\)\[ W_j\cap\left(\sum\limits_{i\neq j}W_i\right)=\{0\} \] 則稱\(V\)\(W_1,W_2,\cdots,W_k\)的直和,記做 \[ V=W_1\oplus W_2\oplus\cdots\oplus W_k \]

定理 14-1

給定向量空間\(V\)的子空間\(W_1,W_2,\cdots,W_k\),其中\(\dim V<\infty\),則以下五個敘述等價:
1. \(V=W_1\oplus W_2\oplus\cdots\oplus W_k\)
2. 若\(V=\sum W_i\)且對於某些\(v_i\in W_i\)\[ v_1+v_2+\cdots+v_k=0 \]\(v_i=0,\forall i\)
3. \(\forall v\in V\)\(v\)可以被唯一表成 \[ v=v_1+v_2+\cdots+v_k \] 其中\(v_i\in W_i\)
4. 若\(\gamma_i\)\(W_i\)的有序基底,則 \[ \gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k \]\(V\)的有序基底。
5. 對於每一個\(i\),存在\(W_i\)的有序基底\(\gamma_i\)使得 \[ \gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k \]\(V\)的有序基底。(證略)

定理 15

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)可對角化 iff. \(V\)\(T\)的特徵空間的直和。

證明:令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)的相異的特徵值。
\(\Rightarrow\)」:若\(T\)可對角化,則考慮\(E_{\lambda_i}\)。令\(\gamma_i\)\(E_{\lambda_i}\)的有序基底。則由定理13-1, \[ \gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k \]\(V\)的有序基底。而由定理14-1(4.到1.)可知 \[ V=E_{\lambda_1}\oplus E_{\lambda_2}\oplus\cdots\oplus E_{\lambda_k} \]
\(\Leftarrow\)」:若\(V=E_{\lambda_1}\oplus E_{\lambda_2}\oplus\cdots\oplus E_{\lambda_k}\),則直接用定理14-1(1.到4.)就做完了。QED