永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:最小多項式

這份筆記是關於最小多項式的定義與性質。

最小多項式

定義 1:最小多項式 (Minimal Polynomial)

給定線性映射\(T:V\to V\),若多項式\(p(t)\)的領導係數為\(1\)且是使\(p(T)=0\)的最低次多項式,則稱\(p(t)\)\(T\)的最小多項式。

定義 1-1:矩陣的最小多項式 (Minimal Polynomial of Matrices)

可以用和定義1類似的方法定義矩陣\(A\in M_{n\times n}(F)\)的最小多項式。

註記 1-2

由凱利-漢米爾頓定理(這裡的定理9),任何\(T\)的最小多項式都存在。

定理 2

\(p(t)\)是線性映射\(T:V\to V\)的最小多項式,其中\(\dim V<\infty\)。則對於所有滿足\(g(T)=0\)的多項式\(g\),有\(p(t)|g(t)\)

證明:由除法原理,我們知道存在\(q(t)\)\(r(t)\)使得 \[ g(t)=q(t)p(t)+r(t) \] 其中\(\deg r<\deg p\)。故 \[ g(T)=q(T)p(T)+r(T) \]\(g(T),p(T)=0\)\(r(T)=0\)。若\(r(t)\)不為零多項式,則這與\(p(t)\)是最小多項式的假設矛盾。故應有\(r\equiv 0\),即\(p(t)|g(t)\)QED

定理 3

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)的最小多項式是唯一的。

證明:若\(p_1(t),p_2(t)\)都是\(T\)的最小多項式,則必須有\(\deg p_1=\deg p_2\)。而由定理2我們知道需要有 \[ p_1|p_2,\;\;p_2|p_1 \] 故應有\(p_1(t)=cp_2(t)\)。但由定義知最小多項式的領導係數應為\(1\),故\(c=1\), \(p_1=p_2\)QED

定理 4

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。令\(p(t)\)\(T\)的最小多項式,則\(\lambda\)\(T\)的特徵值若且為若\(p(\lambda)=0\)

證明:令\(f(t)\)\(T\)的特徵多項式,則由定理2知\(p(t)|f(t)\),即存在多項式\(q(t)\)使得\(f(t)=q(t)p(t)\)。我們接著分成兩部分證明。
\(\Rightarrow\)」:若\(\lambda\)\(T\)的特徵值,則\(f(\lambda)=0\)。令\(0\neq x\)是其對應的特徵向量,即\(T(x)=\lambda x\)。則 \[ 0=p(T)(x)=p(\lambda)x \] 故有\(p(\lambda)=0\)
\(\Leftarrow\)」:若\(p(\lambda)=0\),則有 \[ f(\lambda)=q(\lambda)p(\lambda)=0\cdot q(\lambda)=0 \] 故知\(\lambda\)\(f(t)\)的根,即是\(T\)的特徵值。QED

註記 4-1

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。令其特徵多項式為 \[ f(t)=(\lambda_1-t)^{m_1}(\lambda_2-t)^{m_2}\cdots(\lambda_k-t)^{m_k} \] 並令其最小多項式為 \[ p(t)=(t-\lambda_1)^{n_1}(t-\lambda_2)^{n_2}\cdots(t-\lambda_k)^{m_k} \] 我們知道\(f(t)=0\),故由定理2知\(p(t)|f(t)\)。且由定理4知對所有\(i=1\sim k\)應有\(1\leq n_i\leq m_i\)

定理 5

給定線性映射\(T:V\to V\),其中\(\dim V=n<\infty\)。令\(V\)\(T\)-循環空間。則 \[ \deg(T\mbox{的特徵多項式})=\deg(T\mbox{的最小多項式}) \] 意即\(f(t)=(-1)^n p(t)\)

證明:令\(f\)\(T\)的特徵多項式,\(p\)\(T\)的最小多項式。則由\(V\)\(T\)-循環知存在\(0\neq x\in V\)使得 \[ \beta=\{x,T(x),T^2(x),\cdots,T^{n-1}(x)\} \]\(V\)的基底。令 \[ g(t)=a_0+a_1(t)+\cdots+a_kt^k \] 假設\(\deg g=k<n, a_k\neq 0\),則 \[ g(T)(x)=a_0x+a_1T(x)+\cdots+a_kT^k(x) \] 可以發現\(g(T)(x)\)\(\beta\)中元素的線性組合且\(a_k\neq 0\),故由\(\beta\)是線性獨立知\(g(T)(x)\neq 0\)。故 \[ \deg p(t)=n=\dim V=\deg f(t) \] QED

定理 6

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)可對角化 iff. \(T\)的最小多項式可以表為 \[ p(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k) \] 其中\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)的相異特徵值。

證明:我們分成兩部分證明。
\(\Rightarrow\)」:若\(T\)可對角化,令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)\(T\)的相異特徵值,且令 \[ q(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k) \] 又令\(\beta=\{v_1,v_2,\cdots,v_n\}\)是由\(T\)的特徵向量構成的\(V\)的基底(因為\(T\)可對角化故這樣的基底是存在的),則對於所有\(v_i\in\beta\),存在某個特徵值\(\lambda_j\)使得 \[ (T-\lambda_jI)(v_i)=0 \] 故對於所有\(v_i\in\beta\)\(q(T)(v_i)=0\)。則\(q(T)=0\),而由\(q\)的形式與註記4-1知\(q\)應是最小多項式。
\(\Leftarrow\)」:若\(T\)的最小多項式可表為 \[ p(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k) \] 則我們對\(n=\dim V\)做數學歸納法。當\(n=1\)時定理顯然成立。假設當\(\dim V<n\)時定理都成立,則\(\dim V=n\)時,令\(W=R(T-\lambda_kI)\)。因為有非零特徵向量使得\((T-\lambda_kI)(x)=0\),故\(W\neq V\)。我們接著分兩種狀況討論:
1. 若\(W=\{0\}\),則 \[ R(T-\lambda_kI)=\{0\},\;\; T-\lambda_kI=0 \]\(T=\lambda_kI\)為對角矩陣。
2. 若\(0<\dim W<n=\dim V\),則易知\(W\)\(T\)-不變的。考慮\(T_W:W\to W\),則對所有\(x\in W\),我們知道存在\(y\in V\)使得\(x=(T-\lambda_kI)y\),故 \[ \begin{aligned} (T-\lambda_1I)(T-\lambda_2I)\cdots(T-\lambda_{k-1}I)(x)&=(T-\lambda_1I)(T-\lambda_2I)\cdots(T-\lambda_kI)(y)\\ &=p(T)(y)=0 \end{aligned} \] 故由定理2知\(T_W\)的最小多項式整除\((t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_{k-1})\)。由歸納假設,\(T_W\)是可對角化的且\(\lambda_k\)不是\(T_W\)的特徵值(定理4),故\(W\cap N(T-\lambda_kI)=\{0\}\)。令\(\beta_1=\{v_1,\cdots,v_m\}\)是由\(T_W\)的特徵向量構成的\(W\)的基底,\(\beta_2=\{w_1,\cdots,w_p\}\)\(N(T-\lambda_kI)=E_{\lambda_k}\)的基底。我們希望說明\(\beta_1\cup\beta_2\)是線性獨立的。
\[ \underbrace{a_1v_1+a_2v_2+\cdots+a_mv_m}_{=x\in W}+\underbrace{b_1w_1+b_2w_2+\cdots+b_pw_p}_{y\in E_{\lambda_k}}=0 \]\(x=-y\in E_{\lambda_k}\)。故\(x\in W\cup E_{\lambda_k}=\{0\}\),即\(x=y=0\)。而由\(\beta_1\)\(\beta_2\)分別線性獨立知\(a_i=b_j=0,\forall i,j\)
於是 \[ |\beta_1\cup\beta_2|=|\beta_1|+|\beta_2|=\dim R(T-\lambda_kI)+\dim N(T-\lambda_kI)=n \]\(\beta_1\cup\beta_2\)\(V\)的基底。且 \[ [T]^{\beta_1\cup\beta_2}_{\beta_1\cup\beta_2}=\left( \begin{array}{c|ccc} [T_W]^{\beta_1}_{\beta_1} & & & \\ \hline & \lambda_k & & \\ & & \ddots & \\ & & & \lambda_k \end{array} \right) \] 故我們知道\(T\)是可對角化的。由數學歸納法,我們知道定理成立。QED

消除子

定義 7:消除子 (Annihilator)

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),若多項式\(p(t)\)領導係數為\(1\)且是使\(p(T)(x)=0\)的最低次多項式,則稱\(p(t)\)\(x\)\(T\)-消除子。

性質 7-1

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),則其\(T\)-消除子\(p(t)\)是唯一的。

證明:若存在領導係數為\(1\)的消除子\(p_1,p_2\)使得\(p_1(T)(x)=p_2(T)(x)=0\),則應有\(\deg p_1=\deg p_2\)。若\(p_1\neq p_2\),則 \[ (p_1-p_2)(T)(x)=0 \]\[ 0<\deg(p_1-p_2)<\deg p_2 \] 這與消除子的定義矛盾,故應有\(p_1=p_2\)QED

性質 7-2

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)\(x\)\(T\)-消除子。則若多項式\(g(t)\)滿足\(g(T)(x)=0\),則\(p(t)|g(t)\)

證明:由定義知\(\deg p\leq\deg g\)。使用除法原理,可知存在\(q(t)\)\(r(t)\)使得 \[ g(t)=q(t)p(t)+r(t) \] 其中\(\deg r<\deg p\)。然而 \[ \underbrace{g(T)(x)}_{=0}=q(T)\underbrace{p(T)(x)}_{=0}+r(T)(x) \]\(r(T)(x)=0\)。但\(p(t)\)已經是消除子了,故\(r(t)\equiv 0\)\(p(t)|g(t)\)QED

性質 7-3

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)\(x\)\(T\)-消除子。令\(W\)是由\(x\)生成的\(T\)-循環子空間,則\(p(t)\)\(T_W\)的最小多項式,且 \[ \dim W=\deg p(t) \]

證明:令\(q(t)\)\(T_W\)的最小多項式。由性質7-2,我們知道\(p(t)\)整除\(q(t)\)。若\(p\)的次數低於\(q\)的次數,則令\(\dim W=k\),有 \[ p(T)(x)=0, p(T)T(x)=0, p(T)T^2(x)=0,\cdots,p(T)T^{k-1}(x)=0 \] 然而\(\{x,T(x),T^2(x),\cdots,T^{k-1}(x)\}\)\(W\)的基底,故 \[ p(T_W)=(p(T))_W=0 \] 這與\(q\)是最小多項式的假設矛盾,故\(p\)就是\(T_W\)的最小多項式。而由於\(W\)的特徵多項式是\(k\)次(見這裡的註記4-3),故由定理5知\(\dim W=\deg p\)QED

性質 7-4

給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)\(x\)\(T\)-消除子。則\(\deg p=1\) iff. 存在\(\lambda\)使得\((T-\lambda I)(x)=0\) iff. \(x\)\(T\)的特徵向量。

證明:由消除子的定義易得。QED