這份筆記是關於矩陣可對角化的條件。
特徵值、特徵向量與特徵多項式
定義 1:對角化 (Diagonalization)
考慮線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則我們稱\(T\)是可對角化的,若存在\(V\)的有序基底\(\beta\)使得\([T]_\beta\)是對角矩陣。而對於矩陣\(A\in M_{n\times n}(F)\)。我們稱\(A\)可對角化,若\(L_A\)可對角化。
定義 2:特徵值與特徵向量 (Eigenvalue and Eigenvector)
給定可對角化的線性映射\(T:V\to V\),則存在\(V\)的基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right) \] 令\(\beta=\{v_1,v_2,\cdots,v_n\}\)則有 \[ T(v_i)=\lambda_iv_i \] 則我們將使\(T(v)=\lambda v\)的\(\lambda\)稱為\(T\)的特徵值,並將\(v\neq 0\)稱為特徵向量。而矩陣\(A\in M_{n\times n}(F)\)的特徵值與特徵向量即定義為\(L_A\)的特徵值與特徵向量。
定理 3
給定\(A\in M_{n\times n}(F)\),則\(\lambda\in F\)是\(A\)的特徵值 iff. \[ \det(A-\lambda I_n) \]
證明:我們知道\(\lambda\in F\)是\(A\)的特徵值\(\Leftrightarrow\)存在\(0\neq v\in F^n\)使得\(Av=\lambda v\) i.e. \[ (A-\lambda I_n)(v)=0 \] \(\Leftrightarrow N(A-\lambda I_n)\neq\{0\}\Leftrightarrow\det(A-\lambda I_n)=0\)。QED
定義 4:特徵多項式 (Characteristic Polynomial)
給定\(A\in M_{n\times n}(F)\),我們稱\(f(t)=\det(A-tI_n)\)為\(A\)的特徵多項式。而對於線性映射\(T:V\to V\),我們將其特徵多項式定義為\([T]^\beta_\beta\)的特徵多項式,其中\(\beta\)為\(V\)的意一組有序基底。
註記 4-1
由定理3可以知道\(\lambda\)是\(A\)的特徵值 iff. \(\lambda\)是\(A\)的特徵多項式的根。
註記 4-2
定義4中線性映射\(T:V\to
V\)的特徵多項式與基底\(\beta\)的選取無關。
證明:令\(\beta,\beta'\)為\(V\)的有序基底,則由這裡的定理3知 \[ [T]^{\beta'}_{\beta'}=[I]_\beta^{\beta'}[T]^\beta_\beta[I]^\beta_{\beta'} \] 令\(Q=[I]^\beta_{\beta'}\), \(Q^{-1}=[I]^\beta_{\beta'}\)。則 \[ \begin{aligned} \det\left([T]^{\beta'}_{\beta'}-tI_n\right)&=\det\left([I]_\beta^{\beta'}[T]^\beta_\beta[I]^\beta_{\beta'}-tI_n\right)\\ &=\det(Q^{-1})\det\left([T]^\beta_\beta-tI_n\right)\det(Q)\;\;(Q^{-1}I_nQ=I_n)\\ &=\det\left([T]^\beta_\beta-tI_n\right) \end{aligned} \] 於是知\(T\)的特徵多項式與\(\beta\)的選取無關。QED
註記 4-3
給定\(A\in M_{n\times n}(F)\),則其特徵多項式為\(n\)次多項式,\(t^n\)項係數為\((-1)^n\)。(這是顯然的)
註記 4-4
給定\(A\in M_{n\times n}(F)\),由註記4-3知在\(\mathbb{C}\)中\(A\)的特徵值至多只有\(n\)個。
註記 4-5
給定線性映射\(T:V\to V\),令\(\lambda\)為其特徵值,\(v\)為\(\lambda\)對應的特徵向量,則\(v\in N(T-\lambda I)\)。
註記 4-6
給定\(A\in M_{n\times
n}(F)\),並令\(\beta\)是由\(A\)的特徵向量構成的\(F^n\)的基底(假設這樣的基底存在),並令\(\beta'\)是\(F^n\)的標準基底,又令\(Q=[I]^{\beta'}_\beta\),則\(Q^{-1}AQ\)是對角矩陣。
證明:由這裡的定理3,我們有 \[ [L_A]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right)=[I_V]^\beta_{\beta'}[L_A]^{\beta'}_{\beta'}[I_V]_\beta^{\beta'}=Q^{-1}AQ \] QED
定理 5
給定線性映射\(T:V\to V\),並令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)為\(T\)的相異的特徵值,其對應到的特徵向量分別為\(v_1,v_2,\cdots,v_k\),則\(\{v_1,\cdots,v_k\}\)是線性獨立的。
證明:我們使用數學歸納法來證明。
1. \(k=1\)時,結論是顯然的。
2.
假設命題對\(1,2,\cdots,k-1\)都成立,則若 \[
a_1v_1+a_2v_2+\cdots+a_kv_k=0\mbox{ (☆)}
\] 我們對上式使用線性映射\((T-\lambda_kI)\),則 \[
a_1(\lambda_1-\lambda_k)v_1+a_2(\lambda-\lambda_k)v_2+\cdots+a_{k-1}(\lambda_{k-1}-\lambda_k)v_{k-1}+0=0
\] 由歸納假設,\(\{v_1,\cdots,v_{k-1}\}\)是線性獨立的,故必須有
\[
a_1(\lambda_1-\lambda_k)v_1=a_2(\lambda-\lambda_k)v_2=\cdots=a_{k-1}(\lambda_{k-1}-\lambda_k)v_{k-1}=0
\] 然而\(\lambda_i\)兩兩不同,故
\[
a_1=a_2=\cdots=a_{k-1}=0
\] 代回(☆),有\(a_k=0\),故\(\{v_1,\cdots,v_k\}\)線性獨立。
由數學歸納法可知定理成立。QED
註記 5-1
給定線性映射\(T:V\to V\),其中\(\dim V=n\)。則若\(T\)有\(n\)個不同的特徵值,則\(T\)有\(n\)個線性獨立的特徵向量,即\(T\)可對角化。
定義 6:分裂 (Split)
令\(f(t)\)是係數都在\(F\)中的多項式,我們說\(f\)在\(F\)上分裂,若存在\(c,a_1,a_2,\cdots,a_n\in F\)使得 \[ f(t)=c(t-a_1)(t-a_2)\cdots(t-a_n) \]
定理 7
可對角化線性映射的特徵多項式在\(F\)上分裂。
證明:給定線性映射\(T:V\to V\),由於\(T\)可對角化,故存在\(V\)的有序基底\(\beta\)使得 \[ [T]^\beta_\beta=\left( \begin{array}{cccc} \lambda_1 & & & 0\\ & \lambda_2 & & \\ & & \ddots & \\ 0 & & & \lambda_n \end{array} \right) \] 則\(T\)的特徵多項式為 \[ \det\left( \begin{array}{cccc} \lambda_1-t & & & 0\\ & \lambda_2-t & & \\ & & \ddots & \\ 0 & & & \lambda_n-t \end{array} \right)=(\lambda_1-t)(\lambda_2-t)\cdots(\lambda_n-t) \] QED
特徵空間
定義 8:重數 (Multiplicity)
給定線性映射\(T:V\to V\)並給定其特徵值\(\lambda\),並令其特徵多項式為\(f(t)\)。若我們能把\(f(t)\)表為 \[ f(t)=(t-\lambda)^kg(t) \] 其中\(g(\lambda)\neq 0\),則稱\(\lambda\)的重數為\(k\),記做 \[ \mbox{multi}(\lambda)=k \]
定義 9:特徵空間 (Eigenspace)
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的特徵值\(\lambda\)。則我們定義\(T\)對應\(\lambda\)的特徵空間為 \[ E_\lambda=\{x\in V:T(x)=\lambda x\}=N(T-\lambda I)\subseteq V \]
定理 10
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的特徵值\(\lambda\)。若\(\mbox{multi}(\lambda)=m\),則\(1\leq\dim(E_\lambda)\leq m\)。
證明:令\(\dim(E_\lambda)=p\),並令\(\{v_1,v_2,\cdots,v_p\}\)為\(E_\lambda\)的有序基底。使用取代定理(這裡的定理5)可以把\(\{v_1,v_2,\cdots,v_p\}\)擴展成\(V\)的基底,即 \[ \beta=\{v_1,v_2,\cdots,v_p,v_{p+1},\cdots,v_n\} \] 則 \[ [T]^\beta_\beta=\left( \begin{array}{c|c} \lambda I_p & B\\ \hline O & C \end{array} \right) \] 其中\(O\)為零矩陣。令\(A=[T]^\beta_\beta\),則 \[ \begin{aligned} T\mbox{的特徵多項式}&=\det(A-tI_n)\\ &=\det\left( \begin{array}{c|c} (\lambda-t)I_p & B\\ \hline O & C-tI \end{array} \right)\\ &=\det((\lambda-t)I_p)\det(C-tI)\\ &\mbox{(這裡略過了一些有點恐怖的計算)}\\ &=(\lambda-tI)^p h(t) \end{aligned} \] 而由定義知\(p\leq m\),即 \[ 1\leq\dim(E_\lambda)\leq m \] QED
引理 11
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。任選\(v_i\in E_{\lambda_i}\),若 \[
v_1+v_2+\cdots+v_k=0
\] 則\(v_i=0\), \(\forall i=1\sim k\)。
證明:不是的話就和定理5矛盾了。QED
定理 12
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。並令\(S_i\)為\(E_{\lambda_i}\)的一個有限線性獨立子集,則
\[
S=S_1\cup S_2\cup\cdots\cup S_k
\] 是\(V\)的線性獨立子集。
證明:令\(|S_i|=n_i\),且 \[ S_i=\{v_{i1},v_{i2},\cdots,v_{in_i}\} \] 則若 \[ \mathop{\sum}_{1\leq i\leq k\atop 1\leq j\leq n_i}a_{ij}v_{ij}=0 \] 則令 \[ w_i=\sum_{j=1}^{n_i}a_{ij}v_{ij}\in E_{\lambda_i} \] 則 \[ \sum_{i=1}^k w_i=0 \] 由引理11,有\(w_i=0\),故\(a_{ij}=0\),即\(S\)是線性獨立的。QED
可對角化的條件
定理 13
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\),並給定\(T\)的相異特徵值\(\lambda_1,\lambda_2,\cdots,\lambda_k\)。並假設\(T\)的特徵多項式在\(F\)上分裂。則\(T\)可對角化 iff. \(\mbox{multi}(\lambda_i)=\dim(E_{\lambda_i})\),
\(\forall i=1\sim k\)。
證明:令\(\mbox{multi}(\lambda_i)=m_i\), \(\dim(E_{\lambda_i})=d_i\), \(\dim V=n\)。則由定理10,我們知道\(1\leq d_i\leq m_i\)。
「\(\Rightarrow\)」:若\(T\)可對角化,則存在\(V\)的有序基底\(\beta\)使得\([T]^\beta_\beta\)是對角矩陣,其中\(\beta\)的元素為\(T\)的特徵向量。令 \[
\beta_i=\beta\cap E_{\lambda_i}, |\beta_i|=n_i, |\beta|=n
\] 則 \[
n_i\leq d_i\leq m_i, \sum_{i=1}^k n_i=n, \sum_{i=1}^k m_i=n
\] (最後一條是因為\(T\)的特徵多項式在\(F\)上分裂),故對所有\(i\)應有\(n_i=m_i\),即對所有\(i\)有\(d_i=m_i\)。故有 \[
\mbox{multi}(\lambda_i)=\dim(E_{\lambda_i})
\]
「\(\Leftarrow\)」:若對於所有\(i\)有\(m_i=d_i\),則令\(\beta_i\)是\(E_{\lambda_i}\)的有序基底,則 \[
|\beta_i|=\dim(E_{\lambda_i})=d_i
\] 令 \[
\beta=\beta\cup\beta_2\cup\cdots\cup\beta_k
\] 由定理12,我們知道\(\beta\)是線性獨立的,而 \[
|\beta|=\sum_{i=1}^k|\beta_i|=\sum_{i=1}^k d_i=\sum_{i=1}^k m_i=n
\] 故\(\beta\)是\(V\)的有序基底,且\(\beta\)的元素為\(T\)的特徵向量,故知\(T\)是可對角化的。QED
定理 13-1
沿用定理13的符號。若\(T\)可對角化且\(\beta_i\)是\(E_{\lambda_i}\)的有序基底,則 \[ \beta=\beta_1\cup\beta_2\cup\cdots\cup\beta_k \] 是\(V\)的有序基底,且\([T]^\beta_\beta\)為對角矩陣。
註記 13-2
定理13中可對角化的條件可以等價為 \[ \begin{aligned} \mbox{multi}(\lambda_i)&=\dim(E_{\lambda_i})\\ &=\dim N(T-\lambda_i I)\\ &=n-\mbox{rank}(T-\lambda_i I) \end{aligned} \]
定義 14:直和 (Direct Sum)
給定向量空間\(V\)的子空間\(W_1,W_2,\cdots,W_k\)。我們令 \[ W_1+W_2+\cdots+W_k=\{v_1+v_2+\cdots+v_k:v_i\in W_i\} \] 若\(V=W_1+W_2+\cdots+W_k\)且對於所有\(j\)有 \[ W_j\cap\left(\sum\limits_{i\neq j}W_i\right)=\{0\} \] 則稱\(V\)是\(W_1,W_2,\cdots,W_k\)的直和,記做 \[ V=W_1\oplus W_2\oplus\cdots\oplus W_k \]
定理 14-1
給定向量空間\(V\)的子空間\(W_1,W_2,\cdots,W_k\),其中\(\dim V<\infty\),則以下五個敘述等價:
1. \(V=W_1\oplus W_2\oplus\cdots\oplus
W_k\)
2. 若\(V=\sum
W_i\)且對於某些\(v_i\in W_i\)有
\[
v_1+v_2+\cdots+v_k=0
\] 則\(v_i=0,\forall i\)。
3. \(\forall v\in V\),\(v\)可以被唯一表成 \[
v=v_1+v_2+\cdots+v_k
\] 其中\(v_i\in W_i\)。
4.
若\(\gamma_i\)是\(W_i\)的有序基底,則 \[
\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k
\] 是\(V\)的有序基底。
5.
對於每一個\(i\),存在\(W_i\)的有序基底\(\gamma_i\)使得 \[
\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k
\] 是\(V\)的有序基底。(證略)
定理 15
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)可對角化 iff. \(V\)是\(T\)的特徵空間的直和。
證明:令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)是\(T\)的相異的特徵值。
「\(\Rightarrow\)」:若\(T\)可對角化,則考慮\(E_{\lambda_i}\)。令\(\gamma_i\)是\(E_{\lambda_i}\)的有序基底。則由定理13-1,
\[
\gamma=\gamma_1\cup\gamma_2\cup\cdots\cup\gamma_k
\] 是\(V\)的有序基底。而由定理14-1(4.到1.)可知
\[
V=E_{\lambda_1}\oplus E_{\lambda_2}\oplus\cdots\oplus E_{\lambda_k}
\]
「\(\Leftarrow\)」:若\(V=E_{\lambda_1}\oplus
E_{\lambda_2}\oplus\cdots\oplus
E_{\lambda_k}\),則直接用定理14-1(1.到4.)就做完了。QED