這份筆記是關於最小多項式的定義與性質。
最小多項式
定義 1:最小多項式 (Minimal Polynomial)
給定線性映射\(T:V\to V\),若多項式\(p(t)\)的領導係數為\(1\)且是使\(p(T)=0\)的最低次多項式,則稱\(p(t)\)為\(T\)的最小多項式。
定義 1-1:矩陣的最小多項式 (Minimal Polynomial of Matrices)
可以用和定義1類似的方法定義矩陣\(A\in M_{n\times n}(F)\)的最小多項式。
註記 1-2
由凱利-漢米爾頓定理(這裡的定理9),任何\(T\)的最小多項式都存在。
定理 2
令\(p(t)\)是線性映射\(T:V\to V\)的最小多項式,其中\(\dim V<\infty\)。則對於所有滿足\(g(T)=0\)的多項式\(g\),有\(p(t)|g(t)\)。
證明:由除法原理,我們知道存在\(q(t)\)與\(r(t)\)使得 \[ g(t)=q(t)p(t)+r(t) \] 其中\(\deg r<\deg p\)。故 \[ g(T)=q(T)p(T)+r(T) \] 由\(g(T),p(T)=0\)知\(r(T)=0\)。若\(r(t)\)不為零多項式,則這與\(p(t)\)是最小多項式的假設矛盾。故應有\(r\equiv 0\),即\(p(t)|g(t)\)。QED
定理 3
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)的最小多項式是唯一的。
證明:若\(p_1(t),p_2(t)\)都是\(T\)的最小多項式,則必須有\(\deg p_1=\deg p_2\)。而由定理2我們知道需要有 \[ p_1|p_2,\;\;p_2|p_1 \] 故應有\(p_1(t)=cp_2(t)\)。但由定義知最小多項式的領導係數應為\(1\),故\(c=1\), \(p_1=p_2\)。QED
定理 4
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。令\(p(t)\)為\(T\)的最小多項式,則\(\lambda\)是\(T\)的特徵值若且為若\(p(\lambda)=0\)。
證明:令\(f(t)\)是\(T\)的特徵多項式,則由定理2知\(p(t)|f(t)\),即存在多項式\(q(t)\)使得\(f(t)=q(t)p(t)\)。我們接著分成兩部分證明。
「\(\Rightarrow\)」:若\(\lambda\)是\(T\)的特徵值,則\(f(\lambda)=0\)。令\(0\neq x\)是其對應的特徵向量,即\(T(x)=\lambda x\)。則 \[
0=p(T)(x)=p(\lambda)x
\] 故有\(p(\lambda)=0\)。
「\(\Leftarrow\)」:若\(p(\lambda)=0\),則有 \[
f(\lambda)=q(\lambda)p(\lambda)=0\cdot q(\lambda)=0
\] 故知\(\lambda\)是\(f(t)\)的根,即是\(T\)的特徵值。QED
註記 4-1
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。令其特徵多項式為 \[ f(t)=(\lambda_1-t)^{m_1}(\lambda_2-t)^{m_2}\cdots(\lambda_k-t)^{m_k} \] 並令其最小多項式為 \[ p(t)=(t-\lambda_1)^{n_1}(t-\lambda_2)^{n_2}\cdots(t-\lambda_k)^{m_k} \] 我們知道\(f(t)=0\),故由定理2知\(p(t)|f(t)\)。且由定理4知對所有\(i=1\sim k\)應有\(1\leq n_i\leq m_i\)。
定理 5
給定線性映射\(T:V\to V\),其中\(\dim V=n<\infty\)。令\(V\)是\(T\)-循環空間。則 \[
\deg(T\mbox{的特徵多項式})=\deg(T\mbox{的最小多項式})
\] 意即\(f(t)=(-1)^n
p(t)\)。
證明:令\(f\)是\(T\)的特徵多項式,\(p\)是\(T\)的最小多項式。則由\(V\)是\(T\)-循環知存在\(0\neq x\in V\)使得 \[ \beta=\{x,T(x),T^2(x),\cdots,T^{n-1}(x)\} \] 是\(V\)的基底。令 \[ g(t)=a_0+a_1(t)+\cdots+a_kt^k \] 假設\(\deg g=k<n, a_k\neq 0\),則 \[ g(T)(x)=a_0x+a_1T(x)+\cdots+a_kT^k(x) \] 可以發現\(g(T)(x)\)是\(\beta\)中元素的線性組合且\(a_k\neq 0\),故由\(\beta\)是線性獨立知\(g(T)(x)\neq 0\)。故 \[ \deg p(t)=n=\dim V=\deg f(t) \] QED
定理 6
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。則\(T\)可對角化 iff. \(T\)的最小多項式可以表為 \[
p(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k)
\] 其中\(\lambda_1,\lambda_2,\cdots,\lambda_k\)為\(T\)的相異特徵值。
證明:我們分成兩部分證明。
「\(\Rightarrow\)」:若\(T\)可對角化,令\(\lambda_1,\lambda_2,\cdots,\lambda_k\)是\(T\)的相異特徵值,且令 \[
q(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k)
\] 又令\(\beta=\{v_1,v_2,\cdots,v_n\}\)是由\(T\)的特徵向量構成的\(V\)的基底(因為\(T\)可對角化故這樣的基底是存在的),則對於所有\(v_i\in\beta\),存在某個特徵值\(\lambda_j\)使得 \[
(T-\lambda_jI)(v_i)=0
\] 故對於所有\(v_i\in\beta\)有\(q(T)(v_i)=0\)。則\(q(T)=0\),而由\(q\)的形式與註記4-1知\(q\)應是最小多項式。
「\(\Leftarrow\)」:若\(T\)的最小多項式可表為 \[
p(t)=(t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_k)
\] 則我們對\(n=\dim
V\)做數學歸納法。當\(n=1\)時定理顯然成立。假設當\(\dim V<n\)時定理都成立,則\(\dim V=n\)時,令\(W=R(T-\lambda_kI)\)。因為有非零特徵向量使得\((T-\lambda_kI)(x)=0\),故\(W\neq V\)。我們接著分兩種狀況討論:
1.
若\(W=\{0\}\),則 \[
R(T-\lambda_kI)=\{0\},\;\; T-\lambda_kI=0
\] 則\(T=\lambda_kI\)為對角矩陣。
2. 若\(0<\dim W<n=\dim V\),則易知\(W\)是\(T\)-不變的。考慮\(T_W:W\to W\),則對所有\(x\in W\),我們知道存在\(y\in V\)使得\(x=(T-\lambda_kI)y\),故 \[
\begin{aligned}
(T-\lambda_1I)(T-\lambda_2I)\cdots(T-\lambda_{k-1}I)(x)&=(T-\lambda_1I)(T-\lambda_2I)\cdots(T-\lambda_kI)(y)\\
&=p(T)(y)=0
\end{aligned}
\] 故由定理2知\(T_W\)的最小多項式整除\((t-\lambda_1)(t-\lambda_2)\cdots(t-\lambda_{k-1})\)。由歸納假設,\(T_W\)是可對角化的且\(\lambda_k\)不是\(T_W\)的特徵值(定理4),故\(W\cap N(T-\lambda_kI)=\{0\}\)。令\(\beta_1=\{v_1,\cdots,v_m\}\)是由\(T_W\)的特徵向量構成的\(W\)的基底,\(\beta_2=\{w_1,\cdots,w_p\}\)是\(N(T-\lambda_kI)=E_{\lambda_k}\)的基底。我們希望說明\(\beta_1\cup\beta_2\)是線性獨立的。
令
\[
\underbrace{a_1v_1+a_2v_2+\cdots+a_mv_m}_{=x\in
W}+\underbrace{b_1w_1+b_2w_2+\cdots+b_pw_p}_{y\in E_{\lambda_k}}=0
\] 則\(x=-y\in
E_{\lambda_k}\)。故\(x\in W\cup
E_{\lambda_k}=\{0\}\),即\(x=y=0\)。而由\(\beta_1\)和\(\beta_2\)分別線性獨立知\(a_i=b_j=0,\forall i,j\)。
於是 \[
|\beta_1\cup\beta_2|=|\beta_1|+|\beta_2|=\dim R(T-\lambda_kI)+\dim
N(T-\lambda_kI)=n
\] 故\(\beta_1\cup\beta_2\)是\(V\)的基底。且 \[
[T]^{\beta_1\cup\beta_2}_{\beta_1\cup\beta_2}=\left(
\begin{array}{c|ccc}
[T_W]^{\beta_1}_{\beta_1} & & & \\
\hline
& \lambda_k & & \\
& & \ddots & \\
& & & \lambda_k
\end{array}
\right)
\] 故我們知道\(T\)是可對角化的。由數學歸納法,我們知道定理成立。QED
消除子
定義 7:消除子 (Annihilator)
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),若多項式\(p(t)\)領導係數為\(1\)且是使\(p(T)(x)=0\)的最低次多項式,則稱\(p(t)\)為\(x\)的\(T\)-消除子。
性質 7-1
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),則其\(T\)-消除子\(p(t)\)是唯一的。
證明:若存在領導係數為\(1\)的消除子\(p_1,p_2\)使得\(p_1(T)(x)=p_2(T)(x)=0\),則應有\(\deg p_1=\deg p_2\)。若\(p_1\neq p_2\),則 \[ (p_1-p_2)(T)(x)=0 \] 且 \[ 0<\deg(p_1-p_2)<\deg p_2 \] 這與消除子的定義矛盾,故應有\(p_1=p_2\)。QED
性質 7-2
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)為\(x\)的\(T\)-消除子。則若多項式\(g(t)\)滿足\(g(T)(x)=0\),則\(p(t)|g(t)\)。
證明:由定義知\(\deg p\leq\deg g\)。使用除法原理,可知存在\(q(t)\)與\(r(t)\)使得 \[ g(t)=q(t)p(t)+r(t) \] 其中\(\deg r<\deg p\)。然而 \[ \underbrace{g(T)(x)}_{=0}=q(T)\underbrace{p(T)(x)}_{=0}+r(T)(x) \] 故\(r(T)(x)=0\)。但\(p(t)\)已經是消除子了,故\(r(t)\equiv 0\),\(p(t)|g(t)\)。QED
性質 7-3
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)為\(x\)的\(T\)-消除子。令\(W\)是由\(x\)生成的\(T\)-循環子空間,則\(p(t)\)是\(T_W\)的最小多項式,且 \[ \dim W=\deg p(t) \]
證明:令\(q(t)\)是\(T_W\)的最小多項式。由性質7-2,我們知道\(p(t)\)整除\(q(t)\)。若\(p\)的次數低於\(q\)的次數,則令\(\dim W=k\),有 \[ p(T)(x)=0, p(T)T(x)=0, p(T)T^2(x)=0,\cdots,p(T)T^{k-1}(x)=0 \] 然而\(\{x,T(x),T^2(x),\cdots,T^{k-1}(x)\}\)是\(W\)的基底,故 \[ p(T_W)=(p(T))_W=0 \] 這與\(q\)是最小多項式的假設矛盾,故\(p\)就是\(T_W\)的最小多項式。而由於\(W\)的特徵多項式是\(k\)次(見這裡的註記4-3),故由定理5知\(\dim W=\deg p\)。QED
性質 7-4
給定線性映射\(T:V\to V\),其中\(\dim V<\infty\)。給定\(x\in V\),令\(p(t)\)為\(x\)的\(T\)-消除子。則\(\deg p=1\) iff. 存在\(\lambda\)使得\((T-\lambda I)(x)=0\) iff. \(x\)是\(T\)的特徵向量。
證明:由消除子的定義易得。QED