永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

線性代數:矩陣

這份筆記是關於矩陣的基本性質以及其與線性映射的關聯。

這裡的行與列依循的是台灣的翻譯習慣,即行對應到英文的Column,而列對應到英文的Row。

線性映射的矩陣表示法

定義 1:有序基底 (Ordered Basis)

意思是有序的基底。

例 1-1

考慮\(\mathbb{R}^3\)的兩個基底 \[ \beta=\{(1,0,0),(0,1,0),(0,0,1)\}, \beta'=\{(1,0,0),(0,0,1),(0,1,0)\} \] 作為有序基底來說\(\beta\neq\beta'\),但作為無序基底來說\(\beta=\beta'\)

定義 2:行向量表示 (Column Vector Representation)

\(\beta=\{u_1,\cdots,u_n\}\)\(F\)上的向量空間\(V\)的一組有序基底,則對於\(x\in V\),若 \[ x=a_1u_1+\cdots+a_nu_n \] 其中\(a_1,\cdots,a_n\in F\),則記 \[ [x]_\beta=\left[ \begin{array}{ccc} a_1\\ \vdots\\ a_n \end{array} \right] \]

註記 3

給定線性映射\(T:V\to W\),其中\(\dim V<\infty\), \(\dim W<\infty\),且 \[ \beta=\{v_1,\cdots,v_n\}, \gamma=\{w_1,\cdots,w_m\} \] 分別為\(V\)\(W\)的有序基底,則由這裡的定理11我們知道\(T\)會被\(T(v_1),T(v_2),\cdots,T(v_n)\)的值唯一決定,且每個\(T(v_i)\)都能被唯一表示成\(w_1,w_2,\cdots,w_m\)的線性組合,即 \[ T(v_j)=a_{1j}w_1+a_{2j}w_2+\cdots+a_{mj}w_m \]

定義 3-1:線性映射的矩陣表示法 (Matrix Representation of Linear Transformation)

沿用註記3中的符號,我們給定矩陣\(A\)使得\(A\)的第\(i\)列第\(j\)行的元素為 \[ A_{ij}=a_{ij} \] 則我們稱\(A\)\(T\)的矩陣表示法,記為 \[ A=[T]_\beta^\gamma \]

註記 3-1-1

很容易可以發現\(A\)\(m\times n\)的矩陣。

註記 3-1-2

這裡的定理11知若線性映射\(T:V\to W\)\(U:V\to W\)滿足 \[ [T]_\beta^\gamma=[U]_\beta^\gamma \]\(T=U\)

例 3-1-3

考慮\(T:\mathbb{R}^2\to\mathbb{R}^3\),其中\(\mathbb{R}^2\)的基底是\(\beta=\{(1,0),(0,1)\}\)\(\mathbb{R}^3\)的基底是\(\{(1,0,0),(0,1,0),(0,0,1)\}\)。我們令 \[ T((a_1,a_2))=(a_1+3a_2,a_1,2a_1-4a_2) \]\[ \begin{aligned} T((1,0))&=(1,1,2)=1(1,0,0)+1(0,1,0)+2(0,0,1)\\ T((0,1))&=(3,0,-4)=3(1,0,0)+0(0,1,0)+(-4)(0,0,1) \end{aligned} \] 故我們有 \[ [T]_\beta^\gamma=\left( \begin{array}{ccc} 1 & 3\\ 1 & 0\\ 2 & -4 \end{array} \right) \]

線性映射的向量空間

定義 4:線性映射的運算 (Elementary Arithmetic of Linear Transformations)

給定線性映射\(T,U:V\to W\),其中\(V,W\)\(F\)上的向量空間。則定義映射\((T+U):V\to W\)\[ \forall x\in V, (T+U)(x)=T(x)+U(x) \] 並且對於\(a\in F\),定義映射\(aT:V\to W\)\[ \forall x\in V,(aT)(x)=aT(x) \]

定理 4-1

給定線性映射\(T,U:V\to W\),則:
1. \(\forall a\in F\)\(aT+U\)是線性映射。
2. 所有\(V\to W\)的線性映射構成一個\(F\)上的向量空間。

證明
1. 對於所有\(x,y\in V\), \(c\in F\),有 \[ \begin{aligned} (aT+U)(cx+y)&=aT(cx+y)+U(cx+y)\\ &=a(cT(x)+T(y))+(cU(x)+U(y))\\ &=c(aT(x)+U(x))+(aT(y)+U(y))\\ &=c(aT+U)(x)+(aT+U)(y) \end{aligned} \] 於是知\(aT+U\)是線性映射。
2. 檢查這裡的定義2的8個公理即可,這裡就略過了。其中要注意這裡的零元素指的是零函數,即 \[ \mathbf{0}(x)=0,\forall x\in V \] QED

定義 4-1-1

我們把定理5的第2.點中所有\(V\to W\)的線性映射構成的向量空間記為\(\mathscr{L}(V,W)\)

定理 5

給定線性映射\(T,U:V\to W\),其中\(V,W\)是有限維向量空間,其各自的有序基底為\(\beta\)\(\gamma\),則:
1. \([T+U]_\beta^\gamma=[T]_\beta^\gamma+[U]_\beta^\gamma\)
2. \(\forall a\in F\), \([aT]_\beta^\gamma=a[T]_\beta^\gamma\)

證明
1. 令 \[ \beta=\{v_1,v_2,\cdots,v_n\}, \gamma=\{w_1,w_2,\cdots,w_m\} \] 且令 \[ T(v_j)=\sum_{i=1}^m a_{ij}w_i, U(v_j)=\sum_{i=1}^m b_{ij}w_j \]\[ (T+U)(v_j)=T(v_j)+U(v_j)=\sum_{i=1}^m (a_{ij}+b_{ij})w_j \]\[ \begin{aligned} &\left([T+U]_\beta^\gamma\right)_{ij}=a_{ij}+b_{ij}=\left([T]_\beta^\gamma\right)_{ij}+\left([U]_\beta^\gamma\right)_{ij}\\ \Rightarrow&[T+U]_\beta^\gamma=[T]_\beta^\gamma+[U]_\beta^\gamma \end{aligned} \]
2. 和上面一樣檢查 \[ \left([aT]_\beta^\gamma\right)_{ij}=a\left([T]_\beta^\gamma\right)_{ij} \] 就好了,詳略。QED

合成映射與矩陣乘法

定義 6:合成映射 (Composition Transformation)

給定線性映射\(T:V\to W\), \(U:W\to Z\),我們定義合成映射\(UT:V\to Z\)\[ (UT)(x)=U(T(x)), \forall x\in V \]

定理 6-1

給定線性映射\(T:V\to W\), \(U:W\to Z\),其中\(V,W,Z\)是有限維向量空間,則\(UT:V\to Z\)也是線性映射。

證明:對於\(x,y\in V\), \(a\in F\),有 \[ \begin{aligned} UT(ax+y)&=U(aT(x)+T(y))\\ &=aU(T(x))+U(T(y))\\ &=a(UT(x))+UT(y) \end{aligned} \] 故知\(UT\)是線性映射。QED

定理 6-2

給定\(T,U_1,U_2\in\mathscr{L}(V,V)\),其中\(V\)\(F\)上的向量空間。則:
1. \(T(U_1+U_2)=TU_1+TU_2\)
2. \(T(U_1U_2)=(TU_1)U_2\)
3. 定義單位映射\(I:V\to V\)使得\(\forall x\in V\), \(I(x)=x\),則 \[ TI=IT=T \]
4. \(\forall a\in F\), \(a(U_1U_2)=(aU_1)U_2=U_1(aU_2)\)
(都是顯然的,在此證略。)

定理 7

給定線性映射\(T:V\to W\), \(U:W\to Z\),其中\(\alpha=\{v_1,\cdots,v_n\}\)\(V\)的基底,\(\beta=\{w_1,\cdots,w_m\}\)\(W\)的基底,\(\gamma=\{z_1,\cdots,z_p\}\)\(Z\)的基底,則 \[ [UT]_\alpha^\gamma=[U]_\beta^\gamma\cdot[T]_\alpha^\beta \] 這裡的乘法是矩陣乘法。

證明:令\(B=[T]_\alpha^\beta\), \(A=[U]_\beta^\gamma\),則 \[ \begin{aligned} (UT)(v_j)&=U(T(v_j))\\ &=U\left(\sum_{k=1}^m B_{kj}w_k\right)\\ &=\sum_{k=1}^m B_{kj}U(w_k)\\ &=\sum_{k=1}^m B_{kj}\left(\sum_{i=1}^p A_{ik}z_i\right)\\ &=\sum_{i=1}^p\left(\sum_{k=1}^m A_{ik}B_{kj}\right)z_i \end{aligned} \] 在這裡令\([UT]_\alpha^\gamma=C\),則 \[ C_{ij}=\sum_{k=1}A_{ik}B_{kj} \] 則由矩陣乘法的定義知\(C_{ij}=(AB)_{ij}\),即\(C=AB\)QED

定義 8:轉置矩陣 (Transposition Matrix)

對於矩陣\(A\),定義其轉置矩陣\(A^t\)\[ (A^t)_{ij}=A_{ji} \] 意即若\(A\)\(m\times n\)矩陣,則\(A^t\)就是\(n\times m\)矩陣。

註記 8-1

給定矩陣\(A,B\),有 \[ (AB)^t=B^tA^t \]

證明:我們有 \[ \begin{aligned} (AB)_{ij}^t&=(AB)_{ji}\\ &=\sum_k A_{jk}B_{ki}\\ &=\sum_k(B^t)_{ik}(A^t)_{kj}\\ &=(B^tA^t)_{ij} \end{aligned} \] QED

性質 9

對於矩陣\(A,B,C,D,E\),假設底下的矩陣乘法都有定義,則:
1. \(A(B+C)=AB+AC\)
2. \((D+E)A=DA+EA\)
3. \(\forall a\in F\), \((aA)B=A(aB)\)
(都是簡易的,在此證略。)

矩陣的線性映射意涵

定理 10

\(A\)\(m\times n\)矩陣,\(B\)\(n\times p\)矩陣,並令\(u_j\)\(AB\)\(j\)行的行向量,\(v_j\)\(B\)\(j\)行的行向量,則:
1. \(u_j=Av_j\) (注意\(u_j\)\(m\times 1\), \(A\)\(m\times n\), \(v_j\)\(n\times 1\))。
2. \(v_j=Be_j\),其中 \[ e_j=\left( \begin{array}{cccc} a_1\\ a_2\\ \vdots\\ a_p \end{array} \right), \left\{ \begin{aligned} a_i=0&,\mbox{ for }i\neq j\\ a_j=1& \end{aligned} \right. \] (注意\(v_j\)\(n\times 1\), \(B\)\(n\times p\), \(e_j\)\(p\times 1\))。
(證明是簡易的,在此略。)

定義 10-1:標準向量 (Standard Vector)

我們將定理10中的\(e_j\)稱為\(F^p\)中的標準向量。

定理 11

給定線性映射\(T:V\to W\),其中\(V,W\)\(F\)上的向量空間,且\(\dim V,\dim W<\infty\),並令\(\beta,\gamma\)分別為\(V\)\(W\)的基底。則對於\(u\in V\),有 \[ [T(u)]_\gamma=[T]_\beta^\gamma[u]_\beta \]

證明 1:固定\(u\in V\),定義函數\(f:F\to V\)\[ f(a)=au,\forall a\in F \] 並定義函數\(g:F\to W\)\[ g(a)=aT(u),\forall a\in F \] 則易知\(f,g\)都是線性映射(可以把\(F\)理解成\(F\)上的向量空間),且\(g=Tf\)。則 \[ \begin{aligned} [T(u)]_\gamma&=[g(1)]_\gamma\\ &=[g]_\alpha^\gamma\\ &(\mbox{這裡}\alpha=\{1\}\mbox{是}F\mbox{的基底})\\ &=[Tf]_\alpha^\gamma\\ &=[T]_\beta^\gamma[f]_\alpha^\beta\mbox{ (定理7)}\\ &=[T]_\beta^\gamma[f(1)]_\beta\\ &=[T]_\beta^\gamma[u]_\beta \end{aligned} \] QED

證明 2:令\(\beta=\{u_1,\cdots,u_n\}\), \(\gamma=\{w_1,\cdots,w_m\}\),並令\([T]_\beta^\gamma=A\),則 \[ T(u_j)=\sum_{i=1}^m A_{ij}w_i \] 由於\(u\in V\),故存在\(a_1,a_2,\cdots,a_n\in F\)使得 \[ u=a_1u_1+\cdots+a_nu_n \]\[ [u]_\beta=\left( \begin{array}{ccc} a_1\\ \vdots\\ a_n \end{array} \right) \]\[ T(u)=T\left(\sum_{i=1}^n a_iu_i\right)=\sum_{i=1}^n a_iT(u_i)=\sum_{i=1}^n\sum_{k=1}^m a_iA_{ki}w_k \] 故有 \[ [T(u)]_\gamma=\left( \begin{array}{ccc} \sum\limits_{i=1}^n A_{1i}a_i\\ \sum\limits_{i=1}^n A_{2i}a_i\\ \vdots \end{array} \right)=A\left( \begin{array}{ccc} a_1\\ \vdots\\ a_n \end{array} \right)=[T]_\beta^\gamma[u]_\beta \] QED

定義 12:矩陣映射 (Matrix Transformation)

對於元素都在\(F\)中的\(m\times n\)矩陣\(A\),我們定義線性映射\(L_A:F^n\to F^m\)\[ L_A(x)=Ax \] 其中\(x\in F^n\)是寫成行向量的形式。

定義 13:標準基底 (Standard Basis)

考慮向量空間\(F^n\),則其標準基底為有序基底 \[ \beta=\{e_1,e_2,\cdots,e_n\} \] 其中\(e_i\)為定義10-1中的標準向量。

定理 14

給定\(m\times n\)矩陣\(A\)與映射\(L_A:F^n\to F^m\),並令\(\beta,\gamma\)\(F^n, F^m\)的標準基底,並給定另一\(m\times n\)矩陣\(B\),則:
1. \([L_A]_\beta^\gamma=A\)
2. \(L_A=L_B\Leftrightarrow A=B\)
3. \(L_{A+B}=L_A+L_B\)
4. \(\forall a\in F\), \(L_{aA}=aL_A\)

證明
1. 由定義\([L_A]_\beta^\gamma\)的第\(j\)行是\(L_A(e_j)\),而由定理10知 \[ L_A(e_j)=Ae_j \] 而這即是\(A\)的第\(j\)行,故確有 \[ [L_A]_\beta^\gamma=A \]
2. 由第1.點,若\(L_A=L_B\),則 \[ A=[L_A]_\beta^\gamma=[L_B]_\beta^\gamma=B \] 而若\(A=B\),則對於所有\(x\)\(Ax=Bx\),故 \[ [L_A]_\beta^\gamma=[L_B]_\beta^\gamma \]
3. 對於所有\(x\),我們有 \[ L_{A+B}(x)=(A+B)(x)=Ax+Bx=L_A(x)+L_B(x) \]\[ L_{A+B}=L_A+L_B \]
4. 與第3.點同理,詳略。QED

定理 15

給定線性映射\(T:F^m\to F^n\),則存在唯一\(m\times n\)矩陣\(C\)使得\(T=L_C\)

證明:令\(C=[T]_\beta^\gamma\),則由定理11,有 \[ [T(x)]_\gamma=[T]_\beta^\gamma[x]_\beta \] 意即 \[ T(x)=Cx=L_C(x),\forall x\in F^n \]\(T=L_C\)
而若也存在另一\(C'\)使得\(T=L_{C'}\),則\(L_C=L_{C'}\)。由第2.點,有\(C=C'\)。故有唯一性。QED

定理 16

\(A\)\(m\times n\)矩陣,\(E\)\(n\times p\)矩陣,則\(L_{AE}=L_AL_E\)

證明:我們有 \[ \begin{aligned} L_{AE}(e_j)&=AEe_j\\ &=AE\mbox{的第}j\mbox{行}\\ &=A\times (E\mbox{的第}j\mbox{行})\mbox{ (定理10)}\\ &=A(Ee_j)=L_A(Ee_j)=L_A\left(L_E(e_j)\right) \end{aligned} \] 故有\(L_{AE}=L_AL_E\)QED

定義 17:單位矩陣 (Unit Matrix)

我們說\(n\)階單位矩陣\(I_n\)是一\(n\times n\)矩陣,其中 \[ (I_n)_{ij}=\left\{ \begin{aligned} 0&,i\neq j\\ 1&,i=j \end{aligned} \right. \] 即除對角線為\(1\)外其餘元素皆為\(0\)的矩陣。

定義 18:等價映射 (Identity Transformation)

\(F^n\)下的等價映射\(I_{F^n}:F^n\to F^n\)為函數 \[ \forall x\in F^n, I_{F^n}(x)=x \]

定理 19

我們有 \[ L_{I_n}=I_{F^n} \] (這是顯然的,證略。)