永蔚Alex

Nautical Nonsense and Abstract Nonsense

0%

微積分:多變數函數

這份筆記是關於多變數函數的性質與微分。

n維空間

定義 1:n維空間距離 (Distance in n-dimensional Space)

考慮\(\mathbb{R}^n\)中的兩點\(x=(x_1,x_2,\cdots,x_n), y=(y_1,y_2,\cdots,y_n)\)。則定義兩點間的距離為 \[ |x-y|=\sqrt{(x_1-y_1)^2+(x_2-y_2)^2+\cdots+(x_n-y_n)^2} \]

定義 2:\(\mathbb{R}^n\)中的極限 (Limit in \(\mathbb{R}^n\))

對於一\(\mathbb{R}^n\)中的數列\(\{x_k\}^\infty_{k=1}\),我們說\(\lim\limits_{k\to\infty}x_k=x\),若\(\forall\epsilon>0\), \(\exists N\in\mathbb{N}\) s.t. \(\forall n>N\)\(|x_n-x|<\epsilon\)

定義 3:矩形 (Rectangle)

定義 3-1:開矩形 (Open Rectangle)

\(a_1,a_2,\cdots,a_n\)\(b_1,b_2,\cdots,b_n\)是給定的值,則定義\(\mathbb{R}^n\)中的開矩形為 \[ \{x=(x_1,x_2,\cdots,x_n)|a_i<x_i<b_i,\forall 1<i<n\} \]

定義 3-2:閉矩形 (Open Rectangle)

\(a_1,a_2,\cdots,a_n\)\(b_1,b_2,\cdots,b_n\)是給定的值,則定義\(\mathbb{R}^n\)中的開矩形為 \[ \{x=(x_1,x_2,\cdots,x_n)|a_i\leq x_i\leq b_i,\forall 1<i<n\} \]

多變數函數

定義 4:多變數函數 (Multivariable Function)

通常來說是指\(f:\mathbb{R}^n\to\mathbb{R}\)的函數。

定義 5:多變數函數的連續 (Continuous of Multivariable Function)

我們說\(f:\mathbb{R}^n\to\mathbb{R}\)\(a\)連續,若\(\forall\epsilon>0\), \(\exists\delta>0\) s.t. \(|x-a|<\delta\)時,有\(|f(x)-f(a)|<\epsilon\)

例 5-1

多變數函數的連續比單變數複雜許多。如考慮 \[ f(x,y)=\frac{2xy}{x^2+y^2}, f(0,0)=0 \] 若我們要說\(f\)\((0,0)\)連續,則需要說「任何一條」趨近\((0,0)\)的路徑極限都是\(0\)。考量如下圖1的三條\(x'\to(0,0)\)的路徑:
1. \(x'=(0,y)\),則\(f(x')\equiv 0\)
2. \(x'=(x,0)\),則\(f(x')\equiv 0\)
3. \(x'=(x,x)\),則\(f(x')\equiv 1\)
於是可以發現\(f(x,y)\)\((0,0)\)並不連續。

圖1

定義 6:多變數函數的一致連續 (Uniform Continuous of Multivariable Function)

給定\(f:\mathbb{R}^n\to\mathbb{R}\),若\(\forall\epsilon>0\), \(\exists\delta>0\) s.t. \(|x-y|<\delta\)時,\(|f(x)-f(y)|<\epsilon\),則說\(f\)一致連續。

偏微分

定義 7:偏微分 (Partial Derivative)

對於\(f:\mathbb{R}^n\to\mathbb{R}\)\(x=(x_1,x_2,\cdots,x_n)\)。若極限 \[ \lim_{h\to 0}\frac{f(x_1+h,x_2,\cdots,x_n)-f(x_1,x_2,\cdots,x_n)}{h} \] 存在,則說在\(x\)\(f\)\(x_1\)的偏微分存在。

註記 7-1

上述偏微分大致能理解成\(f\)\(x_1\)方向的斜率。

定義 7-2

\(f\)\(x\)的偏微分有三種記法: \[ \frac{\partial f}{\partial x}, D_xf, f_x \]

註記 7-3

或者是說,\(f\)\(x_1\)的偏微分可以理解為把\(x_2,x_3,\cdots,x_n\)視作常數,對\(x_1\)微分。

例 7-4

\(f(x,y)=x^2+y^2\),則 \[ \frac{\partial f}{\partial x}=2x, \frac{\partial f}{\partial y}=2y \]

例 7-5

\(f(x,y)=xy\),則 \[ \frac{\partial f}{\partial x}=y, \frac{\partial f}{\partial y}=x \]

定義 7-6

如是可以定義更高階的偏微分,通常記為: \[ \begin{aligned} \frac{\partial}{\partial x}\left(\frac{\partial f}{\partial x}\right)&=\frac{\partial^2f}{\partial x^2}\\ \frac{\partial}{\partial y}\left(\frac{\partial f}{\partial x}\right)&=\frac{\partial^2f}{\partial y\partial x}\\ \end{aligned} \] 等等。

註記 7-7

可以偏微分不代表會連續。

例 7-7-1

我們前面看過 \[ f(x,y)=\frac{2xy}{x^2+y^2}, f(0,0)=0 \]\((0,0)\)不連續,但 \[ \begin{aligned} \frac{\partial f}{\partial x}(0,0)&=\lim_{h\to 0}\frac{f(h,0)-f(0,0)}{h}\\ &=\lim_{h\to 0}\frac{0-0}{h}=0 \end{aligned} \] 同理\(\frac{\partial f}{\partial y}(0,0)=0\)

定理 8

\(f=f(x,y)\)\((x_0,y_0)\)有偏微分且對於所有在\((x_0,y_0)\)附近的\((x,y)\)都有 \[ \begin{aligned} \left|\frac{\partial f}{\partial x}(x,y)\right|&\leq M<\infty\\ \left|\frac{\partial f}{\partial y}(x,y)\right|&\leq M<\infty \end{aligned} \] 對於某個\(M\geq 0\),則\(f\)\((x_0,y_0)\)連續。(這裡以雙變數為例,多變數同理)

證明:固定\((x_0,y_0)\)。考慮\((x_0+h,y_0+k)\),其中\(h,k\)很小。我們希望估計\(f(x_0+h,y_0+k)-f(x_0,y_0)\)。我們有 \[ \begin{aligned} |f(x_0+h,y_0+k)-f(x_0,y_0)|&=|f(x_0+h,y_0+k)-f(x_0+h,y)+f(x_0+h)-f(x_0,y_0)|\\ &=|kf_y(x_0+h,y_0+\theta_1k)+hf_x(x_0+\theta_2h,y_0)|\\ &\mbox{(微分均值定理)}\\ &\leq M(|h|+|k|) \end{aligned} \] 故知\(f\)\((x_0,y_0)\)連續。QED

註記 8-1

有偏微分不一定連續,但有偏微分又有界就會連續。

註記 9

一般來說, \[ \frac{\partial^2 f}{\partial x\partial y}, \frac{\partial^2 f}{\partial y\partial x} \] 不一定會相等

例 9-1

考慮 \[ f(x,y)=\frac{xy(x^2-y^2)}{x^2+y^2}, f(0,0)=0 \] 可以發現 \[ \begin{aligned} \frac{\partial f}{\partial x}(0,y)=-y&, \frac{\partial f}{\partial x}(x,0)=x\\ \frac{\partial^2 f}{\partial y\partial x}(0,0)=-1&, \frac{\partial^2 f}{\partial x\partial y}(0,0)=1 \end{aligned} \] 兩者並不相等。

定理 9-2

\(\frac{\partial^2 f}{\partial x\partial y}\)\(\frac{\partial^2 f}{\partial y\partial x}\)\((x_0,y_0)\)附近連續,則 \[ \frac{\partial^2 f}{\partial x\partial y}(x_0,y_0)=\frac{\partial^2 f}{\partial y\partial x}(x_0,y_0) \]

證明:考慮以下四個點:\((x+h,y+k)\), \((x+h,y)\), \((x,y+k)\), \((x,y)\)。令 \[ A=f(x+h,y+k)-f(x+h,y)-f(x,y+k)+f(x,y) \]\(\phi(x)=f(x,y+k)-f(x,y)\),則 \[ \begin{aligned} A&=\phi(x+h)-\phi(x)\\ &=h\phi_x(x+\theta_1h)\\ &\mbox{(微分均值定理)}\\ &=h(f_x(x+\theta_1h,y+k)-f_x(x+\theta_1h,y))\\ &=hkf_{yx}(x+\theta_1h,y+\theta_2k)\\ &\mbox{(微分均值定理)} \end{aligned} \] 又令\(\psi(y)=f(x+h,y)-f(x,y)\),則同上有 \[ A=\psi(y+k)-\psi(y)=khf_{xy}(x+\theta_1'h,y+\theta_2'k) \] 於是有 \[ f_{yx}(x+\theta_1h,y+\theta_2k)=f_{xy}(x+\theta_1'h,y+\theta_2'k) \]\(h,k\to 0\)時,由於\(f\)連續,故\(f_{yx}(x,y)=f_{xy}(x,y)\)QED

導數

註記 10

在單變數微分中我們通常用的定義是 \[ g'(x_0)=\lim_{h\to 0}\frac{g(x_0+h)-g(x_0)}{h} \] 然而我們在這裡的定理10也看過 \[ g(x_0+h)-g(x_0)=Ah+\epsilon(h) \] 其中當\(h\to 0\)\(\epsilon(h)\to 0\)。我們可以用此來定義多變數微分。

定義 11:多變數函數的導數 (Derivative of Multivariable Function)

我們說\(f:\mathbb{R}^n\to\mathbb{R}\)\(x_0=(x_1^0,x_2^0,\cdots,x_n^0)\)可微,若存在向量\(\vec{A}\in\mathbb{R}^n\) s.t. \[ f(x_0+h)-f(x_0)=\vec{A}\cdot\vec{h}+\epsilon(\vec{h})|\vec{h}| \] 其中\(\vec{h}\)\(\mathbb{R}^n\)中的小小向量(\(\vec{A}\cdot\vec{h}\)內積)且當\(|\vec{h}|\to 0\)\(\epsilon(\vec{h})\to 0\)

註記 11-1

給定函數\(f\),則
1. 若\(f\)\(x\)可微,則\(f\)\(x\)連續。
2. 若\(f\)\(x\)可微,則\(f\)各方向的偏微分都存在,且\(\frac{\partial f}{\partial x_i}=A\)\(x_i\)分量(令\(h=(0,0,\cdots,0,h_i,0,\cdots,0)\)就好)。

定理 12

\(f(x,y)\)\((x_0,y_0)\)的偏微分連續,則\(f\)\((x_0,y_0)\)可微。

證明:由微分均值定理,我們有 \[ \begin{aligned} f(x+h,y+k)-f(x,y)&=f(x+h,y+k)-f(x,y+k)+f(x,y+k)-f(x,y)\\ &=hf_xf(x+\theta_1h,y+k)+kf_y(x,y+\theta_2k) \end{aligned} \] 由於\(f_x\)\(f_y\)\((x,y)\)連續,故有 \[ f_x(x+\theta_1 h,y+k)=f_x(x,y)+\epsilon_1(h,k) \] 其中當\(h,k\to 0\)\(\epsilon_1(h,k)\to 0\)。同理有 \[ f_y(x,y+\theta_2k)=f_x(x,y)+\epsilon_2(h,k) \]\[ \begin{aligned} f(x+h,y+k)-f(x,y)&=hf_x(x,y)+kf_y(x,y)+\epsilon_1(h,k)h+\epsilon_2(h,k)k\\ &=hf_x(x,y)+kf_y(x,y)+\epsilon'(h,k)\sqrt{h^2+k^2} \end{aligned} \] 其中當\(h,k\to 0\)\(\epsilon'(h,k)\to 0\),故知\(f\)\((x,y)\)可微。QED

註記 12-1

這個定理反過來不一定是成立的。

方向導數

定義 13:方向導數 (Directional Derivative)

給定\(f:\mathbb{R}^n\to\mathbb{R}\)\(\vec{v}=(v_1,v_2,\cdots,v_n)\)。我們說\(f\)\(\vec{v}\)的極限存在,若 \[ \lim_{h\to 0}\frac{f(x_0+h\vec{v}-f(x_0)}{h|\vec{v}|} \] 存在,記作\(\nabla_v f\)

註記 13-1

\(f\)可微,則 \[ \nabla_v f(x,y)=f_x(x,y)\cdot\frac{v_1}{|v|}+f_y(x,y)\cdot\frac{v_2}{|v|} \]

證明:我們有 \[ f(x+h,y+k)-f(x,y)=hf_x+kf_y+\epsilon(h,k)\sqrt{h^2+k^2} \]\(h=h'v_1\), \(k=h'v_2\),則 \[ f(x+h,y+k)-f(x,y)=h'v_1f_x+h'v_2f_y+\epsilon\sqrt{h^2+k^2} \]\[ \nabla_vf=\lim_{h'\to 0}\frac{h'v_1f_x+h'v_2f_y+\epsilon\sqrt{h^2+k^2}}{h'|v|}=f_x\frac{v_1}{|v|}+f_y\frac{v_2}{|v|} \] 因為\(\epsilon\sqrt{h^2+k^2}/h'|v|\to 0\),所以忽略掉了。QED

定義 14

我們說\(f\in C^1\),若\(f\)的一次偏微分連續。
我們說\(f\in C^m\),若\(f\)\(m\)次偏微分連續。
我們說\(f\in C^\infty\),若\(f\)的任意次偏微分都連續。

註記 15:方向導數的幾何概念

\(f\)\(\vec{v}\)方向的方向導數就是沿\(\vec{v}\)方向對\(f\)切一刀,會切出一條曲線(下圖2的紅線),那方向導數就是該曲線在\((x,y)\)斜率。

圖2

定義 16:切平面 (Tangent Plane)

從註記15可以很合理的定義\(f\)\((x,y)\)的切平面,即 \[ \phi(\xi,\eta)=f(x,y)=(\xi-x)f_x(x,y)+(\eta-y)f_y(x,y) \] (這裡\(\xi, \eta\)是變數,\(x,y\)是定值)。於是,在\((x,y)\)上所有方向的切線都落在\(\phi\)上。
(沿用前面的符號,讓 \[ \xi-x=\frac{v_1}{|v|}, \eta-y=\frac{v_2}{|v|} \] 即可。)

註記 16-1

和單變數的狀況(這裡的定理10)一樣,切平面可以用來做一次估計。

註記 17

方向導數可以用切線來表示。若某方向和正\(x\)軸的夾角為\(\alpha\),則方向導數 \[ \nabla_\alpha f=f_x\cos\alpha+f_y\sin\alpha \]

證明:我們可以用\((\xi,\eta)\)表示\(xy\)平面上的點,即 \[ \xi=x+\rho\cos\alpha,\eta=y+\rho\sin\alpha \] (i.e. \(\rho\)\((x,y)\)\((\xi,\eta)\)的距離),則可以令 \[ \tau=f(\xi,\eta)=f(x+\rho\cos\alpha,y+\rho\sin\alpha) \]\[ \nabla_\alpha f(x,y)=\left(\frac{d\tau}{d\rho}\right)_{\rho=0} \] 那麼在\((x,y)\)的很附近,有 \[ \begin{aligned} \tau&=f(x,y)+(\rho-0)\nabla_\alpha f\\ &=f(x,y)+\rho(f_x\cos\alpha+f_y\sin\alpha)\\ &=f(x,y)+(\xi-x)f_x+(\eta-y)f_y \end{aligned} \] QED

定義 18:增量 (Increment)

假設\(f(x,y)\)可微,則令\(u=f(x,y)\),則\(u\)的增量定為 \[ \Delta u=f(x+h,y+k)-f(x,y) \]

定義 19:微分 (Differential)

很合理由定義18可以發現\(\Delta u\approx hf_x+kf_y\)(其實是\(\Delta u=hf_x+kf_y+\epsilon\sqrt{h^2+k^2}\)),將其記為\(df\),即 \[ df=hf_x+kf_y \] 而又有 \[ \begin{aligned} d^2f=d(df)&=h(df)_x+k(df)_y\\ &=h(f_xh+f_yk)_x+k(f_xh+f_yk)_y\\ &=h^2\frac{\partial^2 f}{\partial x^2}+2hk\frac{\partial^2 f}{\partial x\partial y}+k^2\frac{\partial^2 f}{\partial y^2} \end{aligned} \] 於是也會有 \[ d^nf=h^n\frac{\partial^n f}{\partial x^n}+C^n_1h^{n-1}k\frac{\partial^n f}{\partial x^{n-1}\partial y}+C^n_2h^{n-2}k^2\frac{\partial^n f}{\partial x^{n-2}\partial y^2}+\cdots+k^n\frac{\partial^n f}{\partial y^n} \]

定義 20:梯度 (Gradient)

給定函數\(f(x_1,x_2,\cdots,x_n)\),我們稱向量\(\langle f_{x_1}, f_{x_2},\cdots,f_{x_n}\rangle\)\(f\)的梯度,記為\(\nabla f\)\(\mbox{grad } f\)

變數變換

單變數的時候給定\(f(x)\)\(\phi(x)\),則由鏈鎖律能很好的算出\((f(\phi(x)))'\)(見這裡的定理2)。
至於多變數的狀況,令\(u=f(\xi,\eta)\), \(\xi=\phi(x,y)\), \(\eta=\psi(x,y)\)。我們在乎\(u_x\)\(u_y\)(這樣什麼方向的導數都有了)。

定理 21

符號假設同上,有 \[ u_x=f_\xi\phi_x+f_\eta\psi_x, u_y=f_\xi\phi_y+f_\eta\psi_y \]

證明:考慮 \[ \begin{aligned} \Delta\xi&=\xi_x\Delta x+\xi_y\Delta y+\epsilon_1\sqrt{\Delta x^2+\Delta y^2}\\ \Delta\eta&=\eta_x\Delta x+\eta_y\Delta y+\epsilon_2\sqrt{\Delta x^2+\Delta y^2}\\ \Delta u&=f_\xi\Delta\xi+f_\eta\Delta\eta+\epsilon_3\sqrt{\Delta \xi^2+\Delta\eta^2} \end{aligned} \] 全部塞進去,有 \[ \Delta u=(f_\xi\xi_x+f_\eta\eta_x)\Delta x+(f_\xi\xi_y+f_\eta\eta_y)\Delta y+\epsilon\sqrt{\Delta x^2+\Delta y^2} \] 最後一項要整理一些可怕的東西,但反正結論是它夠小可忽略。令\(\Delta x,\Delta y\to 0\),則 \[ u_x=f_\xi\phi_x+f_\eta\psi_x, u_y=f_\xi\phi_y+f_\eta\psi_y \] QED

例 21-1:極座標 (Polar Coordination)

考慮 \[ x=r\cos\theta, y=r\sin\theta \]\[ r=\sqrt{x^2+y^2}, \theta=\arccos\frac{x}{\sqrt{x^2+y^2}} \] 給定 \[ u=f(x,y)=f(r\cos\theta,r\sin\theta)=F(r,\theta) \]\[ \begin{aligned} F_x&=F_rr_x+F_\theta\theta_x\\ &=F_r\frac{x}{r}-F_\theta\frac{y}{r^2}\\ &=F_r\cos\theta-F_\theta\frac{\sin\theta}{r} \end{aligned} \] 同理有 \[ F_y=F_r\sin\theta+F_\theta\frac{\cos\theta}{r} \] 於是我們有 \[ F_x^2+F_y^2=F_r^2+\frac{1}{r^2}F_\theta^2 \] 再努力變形一下式子,有:

註記 21-1-1:拉普拉斯方程 (Laplace Equation)

\[ F_{xx}+F_{yy}=F_{rr}+\frac{1}{r^2}F_{\theta\theta}+\frac{1}{r}F_r \]

圖3 Pierre-Simon Laplace

泰勒展開式

給定函數\(f\)\(x,y,h,k\),令\(F(t)=f(x+th,y+tk)-f(x,y)\), \(0\leq t\leq 1\)。則 \[ F'(t)=f_x(x+th,y+tk)h+f_y(x+th,y+tk)k \] (用上面的定理21就有了),同理有 \[ F''(t)=f_{xx}h^2+2hkf_{xy}+f_{yy}k^2 \] 以及 \[ F^{(n)}(t)=h^nf_{x^n}+C^n_1h^{n-1}kf_{x^{n-1}y}+\cdots \] 又由微分均值定理知存在\(0<\theta<1\)使得\(F(t)-F(0)=F'(\theta t)t\),則 \[ \frac{f(x+ht,y+kt)-f(x,y)}{t}=hf_x(x+\theta ht,y+\theta kt)+kf_y(x+\theta ht,y+\theta kt) \]\(t=1\),則 \[ f(x+h,y+k)-f(x,y)=(x+\theta h,y+\theta k)+kf_y(x+\theta h,y+\theta k) \] 諸如此類,把\(F(t)\)給泰勒展開後再令\(t=1\),就有:

註記 22:多變數泰勒級數 (Multivariable Taylor Expansion)

我們有 \[ f(x+h,y+k)=f(x,y)+df+\frac{1}{2!}d^2f+\frac{1}{3!}d^3f+\cdots+\frac{1}{n!}d^nf+R_n \] 其中剩餘項\(R_n\)可表為拉格朗日形式 \[ R_n=\frac{1}{(n+1)!}(h^{n+1}f_{x^{n+1}}(x+\theta h,y+\theta k)+\cdots+k^{n+1}f_{y^{n+1}}(x+\theta h,y+\theta k)) \] 其中\(0\leq\theta\leq 1\)