物理/多変数解析学
提供: Internet Web School
(→微分(全微分) ) |
(→「9.1 多変数解析学」 ) |
||
(間の28版分が非表示) | |||
1 行: | 1 行: | ||
- | = | + | =「8.1 多変数解析学」 = |
- | == | + | == 序 == |
本章の冒頭の偏微分の導入部については下記の本も参考にしてください。<br/> | 本章の冒頭の偏微分の導入部については下記の本も参考にしてください。<br/> | ||
*[[wikibooks_ja:解析学基礎/多変数関数の微積分|多変数関数の微積分]] | *[[wikibooks_ja:解析学基礎/多変数関数の微積分|多変数関数の微積分]] | ||
6 行: | 6 行: | ||
このテクストで今後叙述していく予定です。<br/> | このテクストで今後叙述していく予定です。<br/> | ||
- | == | + | == 実数値の多変数関数の微分 == |
${\bf R^n}=\{(x_1,x_2,,,x_n) \mid x_i\in{\bf R},i=1,2,\cdots n\}$ の開区間 <br/> | ${\bf R^n}=\{(x_1,x_2,,,x_n) \mid x_i\in{\bf R},i=1,2,\cdots n\}$ の開区間 <br/> | ||
$I^n=\prod_{i=1}^{n}(a_i,b_i)$上で定義された実関数 $y=f(x_1,x_2,,,x_n)$ を考える。<br/> | $I^n=\prod_{i=1}^{n}(a_i,b_i)$上で定義された実関数 $y=f(x_1,x_2,,,x_n)$ を考える。<br/> | ||
18 行: | 18 行: | ||
しかし残念ながら、<br/> | しかし残念ながら、<br/> | ||
$\vec h$はn次元ベクトルなので、割り算は不可能でありこの定義は無効である。 | $\vec h$はn次元ベクトルなので、割り算は不可能でありこの定義は無効である。 | ||
- | === | + | === 偏微分=== |
関数$f$ の変数 $\textbf x$ の第i成分 $x_i$ だけを変数とし、<br/> | 関数$f$ の変数 $\textbf x$ の第i成分 $x_i$ だけを変数とし、<br/> | ||
他の変数は任意の実数に固定$\Bigl(x_j = a_j \quad (j\neq i)\Bigr)$して得られる関数<br/> | 他の変数は任意の実数に固定$\Bigl(x_j = a_j \quad (j\neq i)\Bigr)$して得られる関数<br/> | ||
30 行: | 30 行: | ||
もし、一変数関数 $\phi_{x_j=a_j,j\neq i}(x_i)=f(a_1,a_2,,,a_{i-1},x_i,a_{i+1},,,a_n)$ が、ある点$x_i=a_i$で微分可能ならば、<br/> | もし、一変数関数 $\phi_{x_j=a_j,j\neq i}(x_i)=f(a_1,a_2,,,a_{i-1},x_i,a_{i+1},,,a_n)$ が、ある点$x_i=a_i$で微分可能ならば、<br/> | ||
関数$f$は、点$\vec a = (a_1.a_2,,,,a_n)$で,$x_i$ について'''偏微分可能'''であると言い,<br/> | 関数$f$は、点$\vec a = (a_1.a_2,,,,a_n)$で,$x_i$ について'''偏微分可能'''であると言い,<br/> | ||
- | $\frac{\partial f}{\partial x_i}(\vec a) \triangleq \frac{d\phi_{x_j=a_j,j\neq i}}{dx_i}(a_i)$<br/> | + | $\frac{\partial f}{\partial x_i}(\vec a) \triangleq \frac{d\phi_{x_j=a_j,j\neq i}}{dx_i}(a_i)=\lim_{ h \to 0, h\neq 0}\frac{ f(a_1,a_2,,,a_{i-1},x_{i}+h,a_{i+1},,,a_n)-f(a_1,a_2,,,a_{i-1},x_{i},a_{i+1},,,a_n)}{h}$<br/> |
を、$f(\textbf x)$ の 点$\vec a$ での変数 $x_i$ についての'''偏微分係数'''という。<br/><br/> | を、$f(\textbf x)$ の 点$\vec a$ での変数 $x_i$ についての'''偏微分係数'''という。<br/><br/> | ||
'''定義2(偏導関数)'''<br/> | '''定義2(偏導関数)'''<br/> | ||
85 行: | 85 行: | ||
$ f(x,y) - f(x_0,y_0) = f_{x}(x_0+h\theta,y)h + f_{y}(x_0,y_0+k\theta)k \qquad (b)$<br/> | $ f(x,y) - f(x_0,y_0) = f_{x}(x_0+h\theta,y)h + f_{y}(x_0,y_0+k\theta)k \qquad (b)$<br/> | ||
証明終わり<br/><br/> | 証明終わり<br/><br/> | ||
- | === | + | === 方向微分=== |
$\vec{e_i}$ を直交座標系の$x_i$座標軸の正方向の方向・向きを持つ単位長さのベクトルとする(第i直交座標ベクトルと呼ぼう)。<br/> | $\vec{e_i}$ を直交座標系の$x_i$座標軸の正方向の方向・向きを持つ単位長さのベクトルとする(第i直交座標ベクトルと呼ぼう)。<br/> | ||
多変数関数$y=f(x_1,x_2,,,x_n)$の、点$\textbf x = (x_1,x_2,,,x_n)$での偏微分係数 $\frac{\partial f}{\partial x_i}(x)$ は、<br/> | 多変数関数$y=f(x_1,x_2,,,x_n)$の、点$\textbf x = (x_1,x_2,,,x_n)$での偏微分係数 $\frac{\partial f}{\partial x_i}(x)$ は、<br/> | ||
103 行: | 103 行: | ||
命題1<br/> | 命題1<br/> | ||
(1) $\vec{e_i}$ 方向の微分は、$\vec{e_i}$ 座標軸($x_i$座標軸)に関する偏微分である。<br/> | (1) $\vec{e_i}$ 方向の微分は、$\vec{e_i}$ 座標軸($x_i$座標軸)に関する偏微分である。<br/> | ||
- | ここで、$\vec{e_i}$ は$x_i$ | + | ここで、$\vec{e_i}$ は$x_i$座標軸の正方向に向いた単位長さのベクトル。<br/> |
式で書くと、<br/> | 式で書くと、<br/> | ||
$\frac{\partial f}{\partial \vec{e_i}}(x) = \frac{\partial f}{\partial x_i}(x) $<br/> | $\frac{\partial f}{\partial \vec{e_i}}(x) = \frac{\partial f}{\partial x_i}(x) $<br/> | ||
109 行: | 109 行: | ||
$\frac{\partial f}{\partial \alpha \vec{e_i}}(x) = \alpha \frac{\partial f}{\partial x_i}(x) $<br/> | $\frac{\partial f}{\partial \alpha \vec{e_i}}(x) = \alpha \frac{\partial f}{\partial x_i}(x) $<br/> | ||
- | === | + | === 微分(全微分) === |
この§も、記述を簡単にするため、2変数関数で説明する。<br/> | この§も、記述を簡単にするため、2変数関数で説明する。<br/> | ||
一般のn変数の場合への拡張は、記述は複雑になるが、容易である。 | 一般のn変数の場合への拡張は、記述は複雑になるが、容易である。 | ||
- | ==== | + | ==== 実数値多変数関数の微分可能性 ==== |
- | + | 実数に値をとる二変数の関数の微分可能性をどう定義したらよいだろうか?<br/> | |
- | + | 実数値一変数関数の微分の場合、それと同等の条件はいくつか知られているが、<br/> | |
その中で二変数関数に容易に拡張できるものを採用するのが自然である。<br/> | その中で二変数関数に容易に拡張できるものを採用するのが自然である。<br/> | ||
[[物理/解析入門(1)実数の性質、連続関数、導関数と微分#実数値関数の微分|1.4.1.1 微分係数の意味]] の命題の条件 3)の式(5)が、それに該当する。<br/><br/> | [[物理/解析入門(1)実数の性質、連続関数、導関数と微分#実数値関数の微分|1.4.1.1 微分係数の意味]] の命題の条件 3)の式(5)が、それに該当する。<br/><br/> | ||
122 行: | 122 行: | ||
$f$が 点$(x_0,y_0)\in U$ で'''微分可能'''(あるいは'''全微分可能''')とは、<br/> | $f$が 点$(x_0,y_0)\in U$ で'''微分可能'''(あるいは'''全微分可能''')とは、<br/> | ||
ある定数$c_1,\ c_2$が存在して、<br/> | ある定数$c_1,\ c_2$が存在して、<br/> | ||
- | ノルムが微小な任意のベクトル$\textbf{h}$ $= (h_1,h_2)$に対して | + | ノルムが微小な任意のベクトル$\textbf{h}$ $= (h_1,h_2)$に対して<br/> |
$f(x_0+h_1,y_0+h_2) = f(x_0,y_0) + c_{1}h_1 + c_{2}h_2 + \delta(h_1,h_2)$(注1参照のこと)$\qquad (a)$<br/> | $f(x_0+h_1,y_0+h_2) = f(x_0,y_0) + c_{1}h_1 + c_{2}h_2 + \delta(h_1,h_2)$(注1参照のこと)$\qquad (a)$<br/> | ||
ここで、$\lim_{\bf{h}\to \bf{0}}\delta(h_1,h_2)/\|{\bf h} \| = 0 (注2参照のこと)\qquad (b)$ <br/> | ここで、$\lim_{\bf{h}\to \bf{0}}\delta(h_1,h_2)/\|{\bf h} \| = 0 (注2参照のこと)\qquad (b)$ <br/> | ||
133 行: | 133 行: | ||
(注2)ノルムとしては、どのp-ノルムを用いても良い。<br/> | (注2)ノルムとしては、どのp-ノルムを用いても良い。<br/> | ||
このテキストの[[物理/平面と空間,ベクトルの性質#内積とノルム|「1.4.3 一般のノルムの定義とノルムの同等性」]]を参照のこと。<br/><br/> | このテキストの[[物理/平面と空間,ベクトルの性質#内積とノルム|「1.4.3 一般のノルムの定義とノルムの同等性」]]を参照のこと。<br/><br/> | ||
- | |||
'''定理4'''<br/> | '''定理4'''<br/> | ||
- | $f$が 点$(x_0,y_0)\in U$ で微分可能ならば、 | + | $f$が 点$(x_0,y_0)\in U$ で微分可能ならば、<br/> |
1)$f$ は$(x_0,y_0)$ で偏微分可能で、<br/> | 1)$f$ は$(x_0,y_0)$ で偏微分可能で、<br/> | ||
式(a)の$ c_{1}, c_{2} $ はそれぞれ、点$(x_0,y_0)$ でのx、yに関する偏微分係数である。<br/> | 式(a)の$ c_{1}, c_{2} $ はそれぞれ、点$(x_0,y_0)$ でのx、yに関する偏微分係数である。<br/> | ||
すなわち、$f'(x_0,y_0)=(f_{x}(x_0,y_0),f_{y}(x_0,y_0))$<br/> | すなわち、$f'(x_0,y_0)=(f_{x}(x_0,y_0),f_{y}(x_0,y_0))$<br/> | ||
- | 2)${\bf | + | 2)${\bf h}=(h_1,h_2)^{T}$ を任意のベクトルとすると、<br/> |
- | $f$ は 点$(x_0,y_0)$ で ${\bf | + | $f$ は 点$(x_0,y_0)$ で ${\bf h}$方向に微分可能で、<br/> |
- | $ D_{\textbf{ | + | $ D_{\textbf{h}}f(x_0,y_0)=Df(x_0,y_0){\bf h}$<br/> |
証明<br/> | 証明<br/> | ||
1)を示そう。<br/> | 1)を示そう。<br/> | ||
158 行: | 157 行: | ||
1)の証明終わり<br/> | 1)の証明終わり<br/> | ||
2)を証明しよう。<br/> | 2)を証明しよう。<br/> | ||
- | ${\bf | + | ${\bf h} = {\bf 0}$ の時は、$D_{\textbf{h}}f(x_0,y_0)=0$であることは、方向微分の定義から直ちにわかるので、2)は成り立つ。<br/> |
- | ${\bf | + | ${\bf h} \neq \textbf{0}$ の時;<br/> |
方向微分の定義から<br/> | 方向微分の定義から<br/> | ||
- | $ D_{\textbf{ | + | $ D_{\textbf{h}}f(x_0,y_0)=\lim_{t\to 0,t\neq 0}\frac{f(x_0+th_1,y_0+th_2)-f(x_0,y_0)}{t} \qquad (a)$<br/> |
他方、fが 点$(x_0,y_0)$ で全微分可能なので、<br/> | 他方、fが 点$(x_0,y_0)$ で全微分可能なので、<br/> | ||
- | $ f(x_0 + | + | $ f(x_0 + th_1,y_0 + th_2)-f(x_0,y_0)=Df(x_0,y_0)t\textbf{h}+\delta(th_1,th_2)) |
\qquad (b)$<br/> | \qquad (b)$<br/> | ||
- | ここで、$\frac{\delta( | + | ここで、$\frac{\delta(th_1,th_2)}{\|t{\bf h}\|} \to 0 \quad (\|t{\bf h}\| \to 0 のとき)$<br/> |
式(b)を式(a)の右辺の代入すると、<br/> | 式(b)を式(a)の右辺の代入すると、<br/> | ||
- | $D_{\bf { | + | $D_{\bf {h}}f(x_0,y_0)=\lim_{t\to 0,t\neq 0}\Bigl(Df(x_0,y_0){\bf h}+\frac{\delta(th_1,th_2)}{t}\Bigr)=Df(x_0,y_0){\bf h}$<br/> |
これで2)が示せた。<br/> | これで2)が示せた。<br/> | ||
証明終わり<br/><br/> | 証明終わり<br/><br/> | ||
175 行: | 174 行: | ||
で大変精度よく近似できることを意味する。<br/> | で大変精度よく近似できることを意味する。<br/> | ||
ここで、ベクトルの右肩についているTという記号は、転置演算を表す記号である。<br/> | ここで、ベクトルの右肩についているTという記号は、転置演算を表す記号である。<br/> | ||
- | 本テキストの[[物理/平面と空間,ベクトル#行列|8.1 平面と空間,ベクトルの行列]]を参照のこと。 | + | 本テキストの[[物理/平面と空間,ベクトル#行列|8.1 平面と空間,ベクトルの行列]]を参照のこと。 |
+ | |||
+ | ==== 微分可能性の十分条件 ==== | ||
'''定理5'''<br/> | '''定理5'''<br/> | ||
2変数関数関数 $f(x,y)$ を考える。<br/> | 2変数関数関数 $f(x,y)$ を考える。<br/> | ||
233 行: | 234 行: | ||
'''定理5d の系'''<br/> | '''定理5d の系'''<br/> | ||
$C^{1}$級の関数は微分可能である。<br/><br/> | $C^{1}$級の関数は微分可能である。<br/><br/> | ||
- | ==== | + | ==== 勾配、グラジエント・ベクトル==== |
+ | |||
+ | ==ベクトル値の多変数関数の微分可能性 == | ||
合成関数の微分を論ずるために、微分可能性をベクトル値関数の場合に拡張する。<br/> | 合成関数の微分を論ずるために、微分可能性をベクトル値関数の場合に拡張する。<br/> | ||
本§では[[wikibooks_ja: 高等学校数学C/行列|行列の初歩的知識]]が必要である。<br/><br/> | 本§では[[wikibooks_ja: 高等学校数学C/行列|行列の初歩的知識]]が必要である。<br/><br/> | ||
315 行: | 318 行: | ||
$=g\circ f({\bf x^0}) + Dg({\bf y^0})Df( {\bf x^0} ){\bf h}+Dg({\bf y^0})\delta({\bf h})+\delta'\Bigl({\bf k}({\bf h})\Bigr) $<br/> | $=g\circ f({\bf x^0}) + Dg({\bf y^0})Df( {\bf x^0} ){\bf h}+Dg({\bf y^0})\delta({\bf h})+\delta'\Bigl({\bf k}({\bf h})\Bigr) $<br/> | ||
$\qquad$ ここで、$\epsilon({\bf h}) \triangleq Dg({\bf y^0})\delta({\bf h}) | $\qquad$ ここで、$\epsilon({\bf h}) \triangleq Dg({\bf y^0})\delta({\bf h}) | ||
- | + \delta'\Bigl({\bf k}({\bf h})\Bigr)\qquad \qquad (f)$ | + | + \delta'\Bigl({\bf k}({\bf h})\Bigr)\qquad \qquad (f)$<br/> |
+ | $\qquad$ とおくと、<br/> | ||
$=g\circ f({\bf x^0}) + Dg({\bf y^0})Df({\bf x^0}){\bf h} + \epsilon({\bf h})$<br/> | $=g\circ f({\bf x^0}) + Dg({\bf y^0})Df({\bf x^0}){\bf h} + \epsilon({\bf h})$<br/> | ||
故に、 | 故に、 | ||
327 行: | 331 行: | ||
$\leq \frac{\| Dg({\bf y^0})\delta({\bf h})\|+\|\delta'\Bigl({\bf k}({\bf h})\Bigr) \|}{\|{\bf h}\|}\qquad $(ベクトルの和のノルムの性質を利用)<br/> | $\leq \frac{\| Dg({\bf y^0})\delta({\bf h})\|+\|\delta'\Bigl({\bf k}({\bf h})\Bigr) \|}{\|{\bf h}\|}\qquad $(ベクトルの和のノルムの性質を利用)<br/> | ||
$\qquad $ ここで、[[wikipedia_ja:行列ノルム#誘導されたノルム |行列のノルムとして、ベクトルのノルムから誘導されたノルム]]を用いると、<br/> | $\qquad $ ここで、[[wikipedia_ja:行列ノルム#誘導されたノルム |行列のノルムとして、ベクトルのノルムから誘導されたノルム]]を用いると、<br/> | ||
- | $\qquad \| Dg({\bf y^0})\delta({\bf h})\| \leq \| Dg({\bf y^0})\|\|\delta({\bf h})\| $ | + | $\qquad \| Dg({\bf y^0})\delta({\bf h})\| \leq \| Dg({\bf y^0})\|\|\delta({\bf h})\| $ なので <br/> |
+ | $\leq \| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}$<br/> | ||
+ | 故に<br/> | ||
+ | $\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|}\leq \| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}\qquad \qquad (h)$<br/> | ||
+ | この式の右辺の第1項は、極限$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}$をとると0になる(式(b)より)。<br/> | ||
+ | 第2項は、<br/> | ||
+ | 1) もし${\bf k}({\bf h})\neq {\bf 0}$ならば、<br/> | ||
+ | $\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|} | ||
+ | = \frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf k}({\bf h})\|} | ||
+ | \frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}$<br/> | ||
+ | $= \frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf k}({\bf h})\|} | ||
+ | \frac{\|Df({\bf x^0}){\bf h} + \delta({\bf h}) \|}{\|{\bf h}\|}$<br/> | ||
+ | $\qquad \lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}} \|{\bf k}({\bf h})\| | ||
+ | =\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\|Df({\bf x^0}){\bf h} + \delta({\bf h})\|=0$ であり<br/> | ||
+ | $\qquad \frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}=\frac{\|Df({\bf x^0}){\bf h} + \delta({\bf h}) \|}{\|{\bf h}\|}$<br/> | ||
+ | $\qquad \leq \frac{\|Df({\bf x^0})\|\|{\bf h}\| + \|\delta({\bf h}) \|}{\|{\bf h}\|} = \|Df({\bf x^0})\|+\frac{\|\delta({\bf h}) \|}{\|{\bf h}\|} \to \|Df({\bf x^0})\| \quad ({\bf h} \to {\bf 0})$<br/> | ||
+ | $\qquad $ なので、<br/> | ||
+ | $\qquad \|{\bf h}\|$が小さいとき、 $\frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}$ は有界(ある正数M以下)である。<br/> | ||
+ | 故に、<br/> | ||
+ | $0 \leq \lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}$<br/> | ||
+ | $\leq \lim_{{\bf k}({\bf h}) \to {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{ \| \delta'\bigl({\bf k}({\bf h})\bigr)\| }{\|{\bf k}({\bf h})\|}M = 0\qquad $(式(d)より) <br/> | ||
+ | 故に<br/> | ||
+ | $\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}=0$<br/> | ||
+ | 2) もし${\bf k}({\bf h}) = {\bf 0}$ならば、<br/> | ||
+ | $\|\delta'\bigl({\bf k}({\bf h})\bigr)\|= \|\delta'({\bf 0})\| = 0$なので、<br/>$\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|} = 0$<br/> | ||
+ | この2つを合わせると、<br/> | ||
+ | $\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}=0$<br/> | ||
+ | 故に、式(h)から、<br/> | ||
+ | $\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|} | ||
+ | \leq | ||
+ | \lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\Bigl(\| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}\Bigr) = 0$<br/> | ||
+ | 式(g)が示せた。<br/> | ||
+ | 証明終わり。<br/><br/> | ||
- | + | ${\bf R^n}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、<br/> | |
+ | 点${\bf a} \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_i,x_j}(\cdot)$ が存在し、<br/> | ||
+ | かつ、点${\bf a}$ で連続ならば、<br/> | ||
+ | 1)導関数$f_{x_j}(\cdot)$は、点${\bf a}$ で変数$x_i$ に関して偏微分可能で、<br/> | ||
+ | 2)$f_{x_j,x_i}({\bf a}) = f_{x_i,x_j}({\bf a})$ <br/><br/> | ||
- | == | + | |
+ | == 実数値の多変数関数の高階偏微分 == | ||
(1)二階偏微分<br/> | (1)二階偏微分<br/> | ||
- | + | '''定義''' 一階偏微分可能<br/> | |
+ | $f({\bf x})$ を、n次元空間 ${\bf R^n}$の開集合$U$上で定義され、<br/> | ||
+ | 実数に値をとる関数とする。<br/> | ||
+ | この関数が$U$上で、全ての変数に関する偏導関数<br/> | ||
+ | $f_{x_{i}}({\cdot})\quad (i=1,2,\cdots,n)$<br/> | ||
+ | を持つと仮定する。<br/> | ||
+ | この時 この関数を,U 上で'''一階偏微分可能'''であるという。 | ||
- | + | '''定義''' 二階偏微分係数<br/> | |
- | + | もし、点${\bf x^0}(\in U)$ で、偏導関数$f_{x_{i}}(\cdot)\bigl(\frac{\partial f}{\partial x_i}(\cdot)とも書く\bigr)$が、変数$x_{j}$に関して偏微分可能の時、その偏微分係数を$f_{x_i,x_j}({\bf x^0})\bigl(\frac{\partial ^{2}f}{\partial x_j\partial x_i}({\bf x})とも書く\bigr)$と表わす($i,j=1,2,\cdots,n $ )。<br/><br/> | |
- | ${\bf R^n}$ | + | 物理学や他の数理的分野で、<br/> |
- | 点$ | + | 2つの変数 $x_{i}とx_{j}\quad (i\neq j)$ に関する偏微分の順番を交換したとき、<br/> |
+ | 偏微分係数が変わるか、否かが問題になることが起こる。<br/><br/> | ||
+ | 定理8<br/> | ||
+ | ${\bf R^n}$の開集合Uで定義された一階偏微分可能な実数値関数fに対し、<br/> | ||
+ | 点${\bf a} \in U$ の開近傍W(注参照)で<br/> | ||
$ \qquad \qquad f_{x_i,x_j} \ f_{x_j,x_i}$<br/> | $ \qquad \qquad f_{x_i,x_j} \ f_{x_j,x_i}$<br/> | ||
- | が共に存在し、$ | + | が共に存在し、${\bf a}$において共に連続ならば、<br/> |
- | $ \qquad \qquad f_{x_i,x_j}( | + | $ \qquad \qquad f_{x_i,x_j}({\bf a}) = f_{x_j,x_i}({\bf a})$<br/> |
+ | (注)Wは点${\bf a}$を含む開集合で、$W \subset U$ であること。<br/> | ||
+ | この定理は次の定理の特殊な場合なので証明は略す。<br/><br/> | ||
- | === | + | '''定理9'''<br/> |
- | + | ${\bf R^n}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、<br/> | |
- | + | 点${\bf a} \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_i,x_j}$ が存在し、<br/> | |
+ | かつ、点${\bf a}$ で連続ならば、<br/> | ||
+ | 1)偏導関数$f_{x_j}$は、点${\bf a}$ で変数$x_i$ に関して偏微分可能で、<br/> | ||
+ | 2)$f_{x_j,x_i}({\bf a}) = f_{x_i,x_j}({\bf a})$ <br/><br/> | ||
+ | |||
+ | 証明の記述を簡単にするために、次の2変数関数バージョンの証明をする。<br/> | ||
+ | 定理9は、2つの変数$x_{i},x_{j}$以外の (n-2)個の変数は固定して考えるので、<br/>実質的には2変数関数にかんする命題であり、<br/> | ||
+ | 簡略バージョンの証明はそのまま定理9の証明になっている(ただし、記述が複雑になる)。<br/> | ||
+ | '''定理9d'''(定理9の2変数関数バージョン)<br/> | ||
+ | ${\bf R^2}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、<br/> | ||
+ | 点${\bf a}=(a_1,a_2) \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_1,x_2}$ が存在し、<br/> | ||
+ | かつ、点${\bf a}$ で連続ならば、<br/> | ||
+ | 1)導関数$f_{x_2}$は、点${\bf a}$ で変数$x_1$ に関して偏微分可能で、<br/> | ||
+ | 2)$f_{x_2,x_1}({\bf a}) = f_{x_1,x_2}({\bf a})$ <br/><br/> | ||
+ | 証明;<br/> | ||
+ | 点${\bf a}$を含む集合Wが開集合なので、充分小さな正数$\delta$を選べば、<br/> | ||
+ | 点${\bf a}$を中心とする半径$\delta$の開球体$B_{\delta}({\bf a})$ はWに含まれる。<br/> | ||
+ | $B_{\delta}({\bf a}) \subset W \subset U$<br/> | ||
+ | 今後はこの開球体の上で議論する。<br/> | ||
+ | $f_{x_2,x_1}({\bf a})\triangleq \lim_{h_1 \to 0,h_1 \neq 0}\frac{f_{x_2}(a_1+h_1,a_2)-f_{x_2}(a_1,a_2)}{h_1}$ が存在し、<br/> | ||
+ | $f_{x_2,x_1}({\bf a})= f_{x_1,x_2}({\bf a})$ であることを示せばよい。<br/><br/> | ||
+ | (1)$ f_{x_2}(a_1+h_1,a_2) - f_{x_2}(a_1,a_2) | ||
+ | = \lim_{h_2 \to 0,h_2 \neq 0} | ||
+ | \frac{ f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2) }{h_2} | ||
+ | $ が成立する。<br/><br/> | ||
+ | これは偏微分の定義から明白。<br/> | ||
+ | そこで、<br/> | ||
+ | $D(h_1,h_2)\triangleq f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2) $ と置くと、<br/> | ||
+ | $\lim_{h_1 \to 0,h_1 \neq 0}\frac{1}{h_1}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2}= \lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_1h_2} \qquad \qquad (a)$<br/> | ||
+ | が存在し、$f_{x_1,x_2}({\bf a})$ に等しいことを示せば定理は証明される。<br/><br/> | ||
+ | (2)$\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a}) \qquad \qquad (b)$<br/> | ||
+ | である。<br/> | ||
+ | この部分が、この定理の証明の核心であり、多少の技巧を要する。<br/> | ||
+ | $D(h_1,h_2)$を生成するため次のような関数を導入する。<br/> | ||
+ | $\phi(t)\triangleq f(a_1+th_1,a_2+h_2)-f(a_1+th_1,a_2)\qquad \qquad (c)$<br/> | ||
+ | すると関数$\phi$は<br/> | ||
+ | $\phi(1)-\phi(0) = D(h_1,h_2)$をみたす微分可能な関数であることが容易に確かめられる。<br/> | ||
+ | すると、微分可能な関数に関する中間値の定理が適用出来るので、 <br/> | ||
+ | ある正数$\theta_1 \in (0,1)$ が存在して、<br/> | ||
+ | ${\phi}'(\theta_1 )=\phi(1)-\phi(0) = D(h_1,h_2) \qquad \qquad (d)$<br/> | ||
+ | ところが、$\phi$の定義から、<br/> | ||
+ | ${\phi}'(t)=h_1f_{x_1}(a_1+th_1,a_2+h_2)-h_1f_{x_1}(a_1+th_1,a_2)\qquad \qquad (e)$<br/> | ||
+ | なので、式(d),(e)から<br/> | ||
+ | $ D(h_1,h_2)={\phi}'(\theta_1 )=h_1f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-h_1f_{x_1}(a_1+\theta_1h_1,a_2)$<br/> | ||
+ | $=h_1\Bigl(f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-f_{x_1}(a_1+\theta_1h_1,a_2)\Bigr) \qquad \qquad (f)$<br/> | ||
+ | ここで、定理の仮定により偏導関数 $f_{x_1}$ は開球体$B_{\delta}({\bf a})$上で,<br/> | ||
+ | 変数 $x_2$ に関して偏微分可能なので、中間値の定理が適用できるため、<br/> | ||
+ | $f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-f_{x_1}(a_1+\theta_1h_1,a_2)=h_2{f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) \qquad \qquad (g)$<br/> | ||
+ | を満たす、正数 $\theta_2 \in (0,1)$ が存在することが分かる。<br/> | ||
+ | 式(g)を式(f)の右辺に代入すると<br/> | ||
+ | $ D(h_1,h_2)=h_1h_2{f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) $<br/> | ||
+ | 故に $h_1h_2 \neq 0$ の時、 <br/> | ||
+ | $ \frac{D(h_1,h_2)}{h_1h_2}={f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) $<br/> | ||
+ | 2階偏導関数 ${f_{x_1}}_{x_2}$ は、点${\bf a}=(a_1,a_2)$で連続なので、<br/> | ||
+ | $\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a})$<br/> | ||
+ | が示せた。<br/><br/> | ||
+ | (3)最後に<br/> | ||
+ | $\lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a}) \qquad \qquad (a)$ <br/> | ||
+ | を示そう。<br/><br/> | ||
+ | 1) $\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2} = f_{x_2}(a_1+h_1,a_2)-f_{x_2}(a_1,a_2)$である。<br/> | ||
+ | 何故ならば、<br/> | ||
+ | $ \frac{D(h_1,h_2)}{h_2} = \frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2)}{h_2}$<br/> | ||
+ | $= \frac{\Bigl(f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)\Bigr)-\Bigl(f(a_1,a_2+h_2)-f(a_1,a_2)\Bigr)}{h_2}$<br/> | ||
+ | $=\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}-\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$<br/> | ||
+ | であり、<br/> | ||
+ | $\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}$と<br/> | ||
+ | $\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$は存在するので、<br/> | ||
+ | $ \frac{D(h_1,h_2)}{h_2} $の極限($h_2\to 0,h_2\neq 0)$ が存在し、<br/> | ||
+ | $\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2} = \lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}-\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$<br/> | ||
+ | $=f_{x_2}(a_1+h_1,a_2) - f_{x_2}(a_1,a_2)$<br/> | ||
+ | が得られる。<br/><br/> | ||
+ | 2)次の補題が示されれば、<br/> | ||
+ | $g(h_1,h_2)\triangleq \frac{D(h_1,h_2)}{h_1h_2}$ と置くことにより<br/> | ||
+ | 式(a)が得られる。<br/> | ||
+ | '''補題'''<br/> | ||
+ | 2変数関数 $g(h_1,h_2)$ が、$\{(h_1,h_2)\in B_{\gamma }({\bf 0})|h_1h_2 \neq 0\}$上で定義されているとする。<br/> | ||
+ | もし、<br/> | ||
+ | $\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}g(h_1,h_2)= \alpha \qquad \qquad (h)$ <br/> | ||
+ | と<br/> | ||
+ | $\lim_{h_2 \to 0,h_2 \neq 0}g(h_1,h_2)= \alpha (h_1) \qquad \qquad (i)$<br/> | ||
+ | が同時に成り立つならば、<br/> | ||
+ | $\lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}g(h_1,h_2)=\lim_{h_1 \to 0,h_1 \neq 0}\alpha (h_1)=\alpha$<br/> | ||
+ | である。<br/> | ||
+ | 証明<br/> | ||
+ | 収束の定義から、<br/> | ||
+ | 任意の(小さな)正数 $\epsilon$ に対して、或る正数 $\delta(\epsilon)$ が存在して<br/> | ||
+ | $|h_1|\lt \delta(\epsilon),h_1\neq 0$ を満たす任意の実数 $h_1$ では<br/> | ||
+ | $|\alpha (h_1)-\alpha| \lt \epsilon$ が成り立つことを示せばよい。<br/> | ||
+ | 仮定した式(h)から、<br/> | ||
+ | 任意の正数$\epsilon$ に対して、これに依存して決まるある正数$\delta(\epsilon)$ が存在して<br/> | ||
+ | ${\bf h}=(h_1,h_2)$ が | ||
+ | $\|(h_1,h_2)\| \lt \delta(\epsilon) $ を満たすならば、<br/> | ||
+ | $| \alpha - g(h_1,h_2) | \lt \frac{\epsilon}{2} \qquad \qquad (j)$<br/> | ||
+ | 他方、仮定した式(i)から、<br/> | ||
+ | 任意の非零の$h_1$に対して、ある正数$\delta'(h_1,\epsilon)$が定まって、<br/> | ||
+ | $ | h_2 | \lt \delta'(h_1,\epsilon) $ ならば<br/> | ||
+ | $ | \alpha(h_1) - g(h_1,h_2) | \lt \frac{\epsilon}{2} \qquad \qquad (k)$<br/><br/> | ||
+ | 非零で絶対値が $\frac{\delta(\epsilon)}{2}$ より小さい任意の実数$h_1$をとれば、<br/> | ||
+ | $ |h_2| \lt \min\Bigl(\delta'(h_1,\epsilon),\frac{\delta(\epsilon)}{2}\Bigr)$を満たす | ||
+ | 任意の実数$h_2$に対して、<br/> | ||
+ | 式(j)、(k) が同時に成り立つ(注参照)。<br/> | ||
+ | 故に、<br/> | ||
+ | $ |\alpha - \alpha(h_1) | \leq |\alpha - g(h_1,h_2)| + | g(h_1,h_2)-\alpha(h_1)| \lt \epsilon $<br/> | ||
+ | これで、 | ||
+ | 任意の正数$\epsilon$ に対して、これに依存して決まるある正数$\delta\triangleq \frac{\delta(\epsilon)}{2}$ が存在して<br/> | ||
+ | $ |h_1| \lt \delta $ を満たす任意の非零数 $h_1$ に関して<br/> | ||
+ | $ |\alpha - \alpha(h_1) | \lt \epsilon $<br/> | ||
+ | が証明できた。<br/> | ||
+ | 証明終わり。<br/> | ||
+ | (注)<br/> | ||
+ | $ |h_1| \lt \frac{\delta(\epsilon)}{2} \quad |h_2| \lt \frac{\delta(\epsilon)}{2}$ なので、<br/> | ||
+ | $\|(h_1,h_2) \| \leq |h_1| + |h_2| \lt \delta(\epsilon) $<br/> | ||
+ | が成り立ち、式(j)が成り立つ。 | ||
==== $C^{2}$級の関数 ==== | ==== $C^{2}$級の関数 ==== | ||
+ | 定義<br/> | ||
+ | 定理10<br/> |
2018年5月15日 (火) 05:03 時点における最新版
目次 |
「8.1 多変数解析学」
序
本章の冒頭の偏微分の導入部については下記の本も参考にしてください。
それ以降の内容については、ウィキブックスには殆どないため、
このテクストで今後叙述していく予定です。
実数値の多変数関数の微分
${\bf R^n}=\{(x_1,x_2,,,x_n) \mid x_i\in{\bf R},i=1,2,\cdots n\}$ の開区間
$I^n=\prod_{i=1}^{n}(a_i,b_i)$上で定義された実関数 $y=f(x_1,x_2,,,x_n)$ を考える。
一変数関数の議論から類推するために
以後、$\textbf x:=(x_1,x_2,,,x_n)$とおき、 $y=f(\textbf x)$ と書くこともある。
$I^n \,$上で定義された実数値関数 $\ y=f(\textbf x)=f(x_1,x_2,,,x_n)\,$ の微分について説明する。
一変数の微分から類推すると
微小なベクトル $\textbf h=(h_1,h_2,,,h_n)$ を考え、極限
$\lim_{\vec h \to 0,\vec h\neq 0}\frac{f(\textbf x + \vec h)-f(\textbf x)}{{\bf h} }$
が存在するとき、関数fは微分可能と定義することが考えられる。
しかし残念ながら、
$\vec h$はn次元ベクトルなので、割り算は不可能でありこの定義は無効である。
偏微分
関数$f$ の変数 $\textbf x$ の第i成分 $x_i$ だけを変数とし、
他の変数は任意の実数に固定$\Bigl(x_j = a_j \quad (j\neq i)\Bigr)$して得られる関数
$\phi_{x_j=a_j,j\neq i}(x_i)\triangleq f(a_1,a_2,,,a_{i-1},x_i,a_{i+1},,,a_n) $
を考える。
この関数は、一変数なので、任意の点$x_i $ での微分係数
$\frac{d\phi_{x_j=a_j,j\neq i}}{dx_i}(x_i)\triangleq \lim_{ h \to 0, h\neq 0}\frac{\phi_{x_j=a_j,j\neq i}(x_i+h)-\phi_{x_j=a_j,j\neq i}(x_i)}{h}$
$=\lim_{ h \to 0, h\neq 0}\frac{ f(a_1,a_2,,,a_{i-1},x_{i}+h,a_{i+1},,,a_n)-f(a_1,a_2,,,a_{i-1},x_{i},a_{i+1},,,a_n)}{h}$
を考えることができる。
定義1(偏微分)
もし、一変数関数 $\phi_{x_j=a_j,j\neq i}(x_i)=f(a_1,a_2,,,a_{i-1},x_i,a_{i+1},,,a_n)$ が、ある点$x_i=a_i$で微分可能ならば、
関数$f$は、点$\vec a = (a_1.a_2,,,,a_n)$で,$x_i$ について偏微分可能であると言い,
$\frac{\partial f}{\partial x_i}(\vec a) \triangleq \frac{d\phi_{x_j=a_j,j\neq i}}{dx_i}(a_i)=\lim_{ h \to 0, h\neq 0}\frac{ f(a_1,a_2,,,a_{i-1},x_{i}+h,a_{i+1},,,a_n)-f(a_1,a_2,,,a_{i-1},x_{i},a_{i+1},,,a_n)}{h}$
を、$f(\textbf x)$ の 点$\vec a$ での変数 $x_i$ についての偏微分係数という。
定義2(偏導関数)
$f(\textbf x)$ がどの点$\textbf x$でも $x_i$ に関して偏微分可能であるならば、
任意の点$\textbf x$ にその点における $x_i$ に関する偏微分係数$\frac{\partial f}{\partial x_i}(\textbf x)$を対応させると、新しい関数が得られる。
これを、$f(\textbf x)$ の $x_i$ に関する偏導関数といい、記号
$f_{x_{i}}(\textbf x),\quad D_{x_i}f(\textbf x),\quad \frac{\partial f}{\partial x_i} (\textbf x),\quad \partial f/\partial x_i$
などで表示する。
以後、簡単のために2変数$x, y$ の関数に限定して議論する。
定理1 合成関数の微分(1)
$R^2$ から $R$ への関数$f(x,y)$ と
$R$ から $R$ への関数$g(t)$ の合成関数
$h(x,y)=g(f(x,y))$
を考える。
もし、$f(x,y)$ が $(x_0,y_0)$ で、xに関して偏微分可能で,
$\qquad g(t)$ が、$t_0=f(x_0,y_0)$ において微分可能ならば、
$h(x,y)=g(f(x,y))$ は $(x_0,y_0)$ で、xに関して偏微分可能であり,
$h_{x}(x_0,y_0)=g'(t_0)f_{x}(x_0,y_0) \qquad \qquad (1)$
証明
yを $ y_0 $ に固定して考えると、一変数関数の合成関数の微分になるので、合成関数の微分公式を適用すればよい。
定理2
$f(x,y)$ を
$(x_0,y_0)$ を中心とするある半径rの開球体$B_{r}(x_0,y_0)$上で、$x$について偏微分可能とする。
もし$(x,y)$ を$B_{r}(x_0,y_0)$の点ならば
$x_0$ と $x$ の間の $\xi$ が存在して、
$f(x,y) - f(x,y_0)-\bigl(f(x_0,y) - f(x_0,y_0) \bigr)= (x-x_0)\bigl(f_{x}(\xi,y)-f_{x}(\xi,y_0)\bigr) \qquad (2)$
(注)2次元の開球体$B_{r}(x_0,y_0)\triangleq \{(x,y)\in R^2 | \|(x,y) - (x_0,y_0) \|_{2} \lt r\} $ は、中心が点$(x_0,y_0)$ で半径rの円周で囲まれる内部である。
証明
$ \phi(x)\triangleq f(x,y) - f(x,y_0)$ とおくと、
式()の左辺$ = \phi(x) - \phi(x_0)$
$\quad \phi(x) $ は、$x_0$ の近傍で微分可能なので、平均値の定理から、
$\quad x_0$ と $x$ の間の $\xi$ が存在して、
$= (x-x_0){\phi}'(\xi) = (x-x_0)\bigl(f_{x}(\xi,y)-f_{x}(\xi,y_0)\bigr) $
定理3
$f(x.y)$ を
$(x_0,y_0)$ を中心とする開球体$B_{r}(x_0,y_0)$上で、xについて偏微分可能とする。
もし$(x,y)=(x_0+h,y_0+k)\in B_{r}(x_0,y_0)$ ならば
$f(x,y) = f(x_0,y_0) + hf_{x}(x_0 + h\theta,y) + kf_{y}(x_0,y_0+ k\theta)$
を満たす、$\theta=\theta(h,k) \in (0,1)$ が存在する。
証明
$ g(t) \triangleq f(x_0+ht,y) + f(x_0,y_0+kt) $ というtの関数を導入する。
すると、
$g(1)-g(0) = f(x,y)+f(x_0,y)-\bigl(f(x_0,y)+f(x_0,y_0) \bigr)$
$\qquad \qquad =f(x,y) - f(x_0,y_0)$
関数 $g(t)$ は、閉区間[0,1] を含む開区間上で微分可能なので、
一変数の微分可能関数の平均値の定理から、
ある数 $\theta \in (0,1)$ が存在して、
$g(1)-g(0) = g'(\theta)(1-0) = g'(\theta) \qquad \qquad (a)$
故に、$ f(x,y) - f(x_0,y_0) = g(1)-g(0) = g'(\theta)$
$\qquad $ 関数gの微分は,一変数関数の合成関数の微分公式から
$\qquad g'(t) = f_{x}(x_0+ht,y)h + f_{y}(x_0,y_0+kt)k \qquad (b)$
式(a)、(b) から
$ f(x,y) - f(x_0,y_0) = f_{x}(x_0+h\theta,y)h + f_{y}(x_0,y_0+k\theta)k \qquad (b)$
証明終わり
方向微分
$\vec{e_i}$ を直交座標系の$x_i$座標軸の正方向の方向・向きを持つ単位長さのベクトルとする(第i直交座標ベクトルと呼ぼう)。
多変数関数$y=f(x_1,x_2,,,x_n)$の、点$\textbf x = (x_1,x_2,,,x_n)$での偏微分係数 $\frac{\partial f}{\partial x_i}(x)$ は、
点$\textbf x $ を、第i座標(座標ベクトル$\vec{e}_i$)に平行に無限に小さい距離移動させるときの、関数fの変化率とみなせる。
式で書くと
$\frac{\partial f}{\partial x_i}(x)
= \lim_{h\to 0,h\neq 0}\frac{f(\textbf x + h\vec{e}_i)-f(\textbf x )}{h}$
このように考えると、点$\textbf x = (x_1,x_2,,,x_n)$を、座標ベクトル$\vec{e}_i$に平行ではなく、
任意に指定するベクトル$\vec a$に平行に微小量動かすときの関数fの変化率を考えることもできることが分かるだろう。
定義 方向微分
関数$y=f(x_1,x_2,,,x_n)$の、点$\textbf x = (x_1,x_2,,,x_n)$での,$\vec a$ 方向の微分係数とは、
$\lim_{h\to 0,h\neq 0}\frac{f(\textbf x + h\vec a)-f(\textbf x )}{h}$
のことで、
$\frac{\partial f}{\partial \vec{a}}(x),\quad f_{\vec a}(x),\quad D_{\vec a}f(x)$
などと書く。
命題1
(1) $\vec{e_i}$ 方向の微分は、$\vec{e_i}$ 座標軸($x_i$座標軸)に関する偏微分である。
ここで、$\vec{e_i}$ は$x_i$座標軸の正方向に向いた単位長さのベクトル。
式で書くと、
$\frac{\partial f}{\partial \vec{e_i}}(x) = \frac{\partial f}{\partial x_i}(x) $
(2)$\alpha$ を任意の実数とすると
$\frac{\partial f}{\partial \alpha \vec{e_i}}(x) = \alpha \frac{\partial f}{\partial x_i}(x) $
微分(全微分)
この§も、記述を簡単にするため、2変数関数で説明する。
一般のn変数の場合への拡張は、記述は複雑になるが、容易である。
実数値多変数関数の微分可能性
実数に値をとる二変数の関数の微分可能性をどう定義したらよいだろうか?
実数値一変数関数の微分の場合、それと同等の条件はいくつか知られているが、
その中で二変数関数に容易に拡張できるものを採用するのが自然である。
1.4.1.1 微分係数の意味 の命題の条件 3)の式(5)が、それに該当する。
定義3 微分可能性(全微分可能性)
関数$f(x,y)$が、或る開集合U(\subset {\bf R^2})上で定義されているとする。
$f$が 点$(x_0,y_0)\in U$ で微分可能(あるいは全微分可能)とは、
ある定数$c_1,\ c_2$が存在して、
ノルムが微小な任意のベクトル$\textbf{h}$ $= (h_1,h_2)$に対して
$f(x_0+h_1,y_0+h_2) = f(x_0,y_0) + c_{1}h_1 + c_{2}h_2 + \delta(h_1,h_2)$(注1参照のこと)$\qquad (a)$
ここで、$\lim_{\bf{h}\to \bf{0}}\delta(h_1,h_2)/\|{\bf h} \| = 0 (注2参照のこと)\qquad (b)$
この時、 $\textbf{c} \triangleq (c_1, c_2)$ を、fの点$(x_0,y_0)$における導値(derivative)または微分係数といい、
$f'(x_0,y_0), \ Df(x_0,y_0)$ などと書く。
(注1)$(x_0,y_0)\in U$ で、Uが開集合なので、
$\|\textbf{h}\|$がある正数より小さければ$(x_0+h_1,y_0+h_2)\in U$となり、
関数$f$は、この点で定義されている。
$\delta(h_1,h_2)$は、$h_1,h_2$ の関数である。
(注2)ノルムとしては、どのp-ノルムを用いても良い。
このテキストの「1.4.3 一般のノルムの定義とノルムの同等性」を参照のこと。
定理4
$f$が 点$(x_0,y_0)\in U$ で微分可能ならば、
1)$f$ は$(x_0,y_0)$ で偏微分可能で、
式(a)の$ c_{1}, c_{2} $ はそれぞれ、点$(x_0,y_0)$ でのx、yに関する偏微分係数である。
すなわち、$f'(x_0,y_0)=(f_{x}(x_0,y_0),f_{y}(x_0,y_0))$
2)${\bf h}=(h_1,h_2)^{T}$ を任意のベクトルとすると、
$f$ は 点$(x_0,y_0)$ で ${\bf h}$方向に微分可能で、
$ D_{\textbf{h}}f(x_0,y_0)=Df(x_0,y_0){\bf h}$
証明
1)を示そう。
式(a) で、$h_2=0$ とすると
$f(x_0+h_1,y_0) = f(x_0,y_0) + c_{1}h_1 + \delta(h_1,0)\qquad (c)$
ここで、
$\lim_{h_1 \to 0,h_1 \neq 0}\frac{\delta(h_1,0)}{|h_1|} = 0\qquad (d) $
式(c)の両辺を、$h_1 (\neq 0)$ で割り、整頓すると、
$ \frac{f(x_0+h_1,y_0) - f(x_0,y_0)}{h_1}= c_{1}+\frac{\delta(h_1,0)}{h_1}$
この式の両辺の極限$h_1\to 0$をとると、式(d)から
$\lim_{h_1 \to 0,h_1 \neq 0}\frac{f(x_0+h_1,y_0) - f(x_0,y_0) }{h_1}= c_{1} $
を得る。
この左辺は、xに関する偏微分$\frac{\partial f}{\partial x}(x_0,y_0)$の定義式である。
式(a) で、$x=x_0$ と固定すると,同様の議論で、
$c_2=\frac{\partial f}{\partial y}(x_0,y_0)$ を得る。
1)の証明終わり
2)を証明しよう。
${\bf h} = {\bf 0}$ の時は、$D_{\textbf{h}}f(x_0,y_0)=0$であることは、方向微分の定義から直ちにわかるので、2)は成り立つ。
${\bf h} \neq \textbf{0}$ の時;
方向微分の定義から
$ D_{\textbf{h}}f(x_0,y_0)=\lim_{t\to 0,t\neq 0}\frac{f(x_0+th_1,y_0+th_2)-f(x_0,y_0)}{t} \qquad (a)$
他方、fが 点$(x_0,y_0)$ で全微分可能なので、
$ f(x_0 + th_1,y_0 + th_2)-f(x_0,y_0)=Df(x_0,y_0)t\textbf{h}+\delta(th_1,th_2))
\qquad (b)$
ここで、$\frac{\delta(th_1,th_2)}{\|t{\bf h}\|} \to 0 \quad (\|t{\bf h}\| \to 0 のとき)$
式(b)を式(a)の右辺の代入すると、
$D_{\bf {h}}f(x_0,y_0)=\lim_{t\to 0,t\neq 0}\Bigl(Df(x_0,y_0){\bf h}+\frac{\delta(th_1,th_2)}{t}\Bigr)=Df(x_0,y_0){\bf h}$
これで2)が示せた。
証明終わり
$f$が微分可能ならば、
$f$の点$(x_0,y_0)$での値と、その近くの点$(x_0+h,y_0+k)$での値の差$f(x_0+h,y_0+k)-f(x_0,y_0)$ は、
$ c_1 h + c_2 k = (c_1,c_2)(h,k)^{T}=\Bigl(f_{x}(x_0,y_0),f_{y}(x_0,y_0)\Bigr)(h,k)^{T}$
で大変精度よく近似できることを意味する。
ここで、ベクトルの右肩についているTという記号は、転置演算を表す記号である。
本テキストの8.1 平面と空間,ベクトルの行列を参照のこと。
微分可能性の十分条件
定理5
2変数関数関数 $f(x,y)$ を考える。
もし、偏導関数 $f_{x},f_{y}$ の少なくとも一方が $(x_0,y_0)$ で存在し、
他方が、$(x_0,y_0)$ を中心とする半径$\delta$ の開球体 $B_{\delta}(x_0,y_0)$上で存在し、$(x_0,y_0)$ で連続ならば、
$f(x,y)$ は$(x_0,y_0)$ において、微分可能である。
(注)$\delta$はどんなに小さくてもよい。
証明
$f_{x}$が $B_{\delta}(x_0,y_0)$上で存在し、$(x_0,y_0)$ で連続と仮定して、証明すればよい。(他の場合も同様に議論できるから)。
そこで、$f_{x}$が$B_{\delta}(x_0,y_0)$上で存在し、$(x_0,y_0)$ で連続としよう。
$\|\textbf{h}\|_{2}\lt \delta $ を満たす任意の2次元ベクトル${\textbf h}=(h_{1},h_{2})$をとる。
$f(x_0 + h_1,y_0 + h_2)-f(x_0,y_0) $
$= \Bigl(f(x_0+h_1,y_0+h_2)-f(x_0,y_0+h_2)\Bigr)+\Bigl(f(x_0,y_0+h_2)-f(x_0,y_0)\Bigr) \qquad \qquad (a)$
一変数$h_1$の関数
$\phi(h_1)\triangleq f(x_0+h_1,y_0+h_2) \qquad (b)$
を考えると、$\phi(0)=f(x_0,y_0+h_2)$であり、
$f_{x}$が$U_{\delta}(x_0,y_0)$上で存在するので、微分可能な関数である。
一変数の微分可能な関数の平均値の定理から、ある正数$\theta \in (0,1)$ が存在して、
$\phi(h_1)-\phi(0)=h_1{\phi}'(\theta h_1)$
式(b)を用いて、この式を関数$f$を用いて表すと
$f(x_0+h_1,y_0+h_2)-f(x_0,y_0+h_2)=h_{1}D_{x_1}f(x_0+\theta h_1,y_0+h_2) \qquad (c)$
式(a)の右辺の第2項$f(x_0,y_0+h_2)-f(x_0,y_0)$ を考える
関数$f$の$y$についての偏微分$D_{y}f$が$(x_0,y_0)$で存在することから、
$f(x_0,y_0+h_2)-f(x_0,y_0) = h_2 D_{y}f(x_0,y_0)+\delta(h_2)
\qquad (d)$
ここで$\delta(h_2)$は、$\lim_{h_2\to 0,h_2\neq 0}\frac{\delta(h_2)}{|h_2|}=0$をみたす関数。
式(a)の右辺に、式 (c),(d)を代入すると、
$f(x_0+h_1,y_0+h_2)-f(x_0,y_0) $
$=h_{1}D_{x}f(x_0+\theta h_1,y_0+h_2)+h_2D_{y}f(x_0,y_0)+\delta(h_2)$
$=h_{1}D_{x}f(x_0,y_0)+h_2D_{y}f(x_0,y_0)+ h_{1}\Bigl(D_{x}f(x_0+\theta h_1,y_0+h_2))- D_{x}f(x_0,y_0)\Bigr) + \delta(h_2) \qquad (e)$
$\lim_{\bf{h}\to 0,\bf{h}\neq 0}\frac{h_{1}\Bigl(D_{x}f(x_0+\theta h_1,y_0+h_2))- D_{x}f(x_0,y_0)\Bigr) + \delta(h_2) }{\|\bf{h}\|} = 0\qquad (f)$
を示せば、微分可能性の定義から、所要の命題が証明できたことになる。
$\lim_{\bf{h}\to 0,\bf{h}\neq 0}\frac{\delta(h_2)}{\|\bf{h}\|}=0$は明らか。
$\lim_{\bf{h}\to 0,\bf{h}\neq 0}\frac{h_{1}\Bigl(D_{x}f(x_0+\theta h_1,y_0+h_2))- D_{x}f(x_0,y_0)\Bigr)}{\|\bf{h}\|} $
$=\lim_{\bf{h}\to 0,\bf{h}\neq 0}\frac{h_{1}}{\|\bf{h}\|}\Bigl(D_{x}f(x_0+\theta h_1,y_0+h_2))- D_{x}f(x_0,y_0)\Bigr)$
$\qquad \frac{h_{1}}{\|\bf{h}\|}$ は絶対値が1以下の値で
$\qquad D_{x}f$ は、仮定から $(x_0,y_0)$ で連続なので
$\qquad \lim_{\bf{h}\to 0,\bf{h}\neq 0}\Bigl(D_{x}f(x_0+\theta h_1,y_0+h_2))- D_{x}f(x_0,y_0)\Bigr) = 0$が成り立つので
$= 0$
これで式$(f)$ が示せた。定理2の証明終わり。
(注)この定理はn変数関数の場合にも、次のように拡張できる。
定理5d
n変数関数関数 $f(\bf{x})$ を考える$\Bigl(\bf{x}=(x_1,x_2,\cdots x_{n-1},x_n)\Bigr)$。
もし、偏導関数 $\{f_{x_i}\}_{i=1}^{n}$ の少なくとも一つが $\bf{x}=\bf{x^{0}}$ で存在し、
残りの全ての偏導関数が$x^{0}$ を中心とする半径$\delta$ の開球体 $B_{\delta}(\bf{x^{0}})$上で存在し、$\bf{x^{0}}$ で連続ならば、
$f$ は$\bf{x^{0}}$ において、微分可能である。
証明は、同じようにしてできるので省略する。
定義4
n次元空間$\bf{R^{n}}$ の開集合Uで定義される実数値関数
$f(\bf{x})$ が$C^{1}$級 とは、
全ての偏導関数$\{f_{x_i}\}_{i=1}^{n}$がU上で存在し、
かつ、それらがU上の連続関数であること。
U上で定義され実数値をとる$C^{1}$級関数をすべて集めた集合を $C^{1}(U,\bf{R})$ と書く。
(注)n次元空間$\bf{R^{n}}$ の集合Uが開集合であるとは、
Uの任意の要素$\bf{x}$に対して、十分小さな半径rを選ぶと、
$\bf{x}$を中心とし半径rの開球体$B_{r}(\bf{x})$ がUに含まれること。
定理5d の系
$C^{1}$級の関数は微分可能である。
勾配、グラジエント・ベクトル
ベクトル値の多変数関数の微分可能性
合成関数の微分を論ずるために、微分可能性をベクトル値関数の場合に拡張する。
本§では行列の初歩的知識が必要である。
$\bf{y} = f(\bf{x})$ をn次元空間$\bf{R^n}$の開集合Uで定義され、m次元空間$\bf{R^m}$に値をとる関数とする。
ベクトル$\bf{y}$ と$\bf{x}$ を座標成分表示した縦ベクトルも同じ記号で表示しておく。
$\bf{y}=\begin{pmatrix} y_1 \\ y_{2} \\ \vdots \\ y_{m} \end{pmatrix}\qquad $
$\bf{x}=\begin{pmatrix} x_1 \\ x_{2} \\ x_{3} \\ \vdots \\ x_{n} \end{pmatrix}\qquad $
関数$\bf{y} = f(\bf{x})$を座標成分表示すると
$y_i = f^{i}({\bf x}) \qquad (i=1,2,3,\cdots m)$
定義5 ベクトル値関数の微分可能性
n変数でm次元空間$\bf{R^m}$に値をとる関数$\bf{y} = f(\bf{x})$が点$\bf{x}$で
微分可能(全微分可能ともいう)とは、
その関数を座標成分表示した、m個のn変数実数値関数
$y_i = f^{i}({\bf x}) \qquad (i=1,2,3,\cdots m)$
が全て、${\bf x}$で微分可能(全微分可能)であること。
定理6
$\bf{y} = f({\bf x})$ をn次元空間$\bf{R^n}$の開集合Uで定義され、m次元空間${\bf R^m}$に値をとる関数とする。
この関数の座標成分表示を $y^{i} = f^{i}({\bf x}) \quad (i=1,2,3,\cdots, n)\qquad \qquad (a)$とする。
1.次の条件1)と 2)は等価である。
1)関数 $f$ が、点 ${\bf x^{0}}(\in U)$ で微分可能である。
2)あるm×n行列Cが存在し、
$B_{r}({\bf x^{0}})\subset U$となるような正数rと、
大きさがrより小さい任意のn次元縦ベクトル ${\bf h}$ に対して
$f({\bf x^{0}}+{\bf h})-f({\bf x^{0}})= C{\bf h} + \delta(h_1,h_2,\cdots,h_n) \qquad (a)$
ここで、$\lim_{{\bf h}\to {\bf 0},{\bf h}\neq {\bf 0}}\frac{\delta(h_1,h_2,\cdots,h_n)}{\|\bf{h}\|} = 0 $
3)$C = Df({\bf x^{0}})\triangleq
\begin{pmatrix} Df^{1}({\bf x^{0}}) \\
Df^{2}({\bf x^{0}}) \\
\vdots\\
Df^{m}({\bf x^{0}})\\
\end{pmatrix}$
$=\begin{pmatrix}
\frac{\partial f^{1}}{\partial x_1}(\bf x) & \frac{\partial f^{1}}{\partial x_2}(\bf x) & \frac{\partial f^{1}}{\partial x_3}(\bf x) & \dots & \frac{\partial f^{1}}{\partial x_n}(\bf x)\\
\frac{\partial f^{2}}{\partial x_1}(\bf x) & \frac{\partial f^{1}}{\partial x_2}(\bf x) & \frac{\partial f^{2}}{\partial x_3}(\bf x) & \dots & \frac{\partial f^{2}}{\partial x_n}(\bf x)\\
\frac{\partial f^{3}}{\partial x_1}(\bf x) & \frac{\partial f^{3}}{\partial x_2}(\bf x) & \frac{\partial f^{3}}{\partial x_3}(\bf x) & \dots & \frac{\partial f^{3}}{\partial x_n}(\bf x)\\
\vdots & \vdots & \vdots & \ddots& \vdots\\
\frac{\partial f^{m}}{\partial x_1}(\bf x) & \frac{\partial f^{m}}{\partial x_2}(\bf x) & \frac{\partial f^{m}}{\partial x_3}(\bf x) & \dots & \frac{\partial f^{m}}{\partial x_n}(\bf x)\\
\end{pmatrix}$
証明
容易なので省略する。
定義6
$\bf{y} = f({\bf x})$が点${\bf x}$で微分可能のとき
$C = Df({\bf x^{0}})$ を、関数$f$の${\bf x^{0}}$ での導値(あるいは微分係数)と呼ぶ。
定理7 合成関数の微分
${\bf y} = f({\bf x})$ を${\bf R^l}$ の開集合$U$ から$\bf{R^m}$への関数
${\bf z} = g(\bf{y})$ を$\bf{R^m}$ の開集合$V$ から${\bf R^n}$への関数とする。
もし関数$f$が点$\bf{x^0}(\in U)$で微分可能で、
${\bf y^0}\triangleq f({\bf x^0}) \in V$であり
関数$g$が点${\bf y^0}$で微分可能であるならば
合成関数
${\bf z} = g\circ f({\bf x})\triangleq g(f({\bf x}))$
は、点${\bf x^0}$で微分可能で
その点の導値 $D(g\circ f)({\bf x^0})$は
$D(g\circ f)({\bf x^0}) = Dg({\bf y^0})Df({\bf x^0}) \quad (注参照のこと)\qquad (a)$
である。
(注)右辺はn×m行列$Dg({\bf y^0})$ とm×l行列$Df({\bf x^0})$の行列としての積である。
証明
関数$f$が点${\bf x^0}$で微分可能なので、微分可能の定義から
ノルムの十分小さい任意のl次元ベクトル${\bf h}$に対して、
$f({\bf x^0}+{\bf h}) = f({\bf x^0}) + Df({\bf x^0}){\bf h} + \delta(\bf{h})\qquad (a)$
ここで、$\lim_{{\bf h}\to {\bf 0}}\frac{\delta({\bf h})}{\|{\bf h} \|}= 0\qquad (b)$
同様に、ノルムの十分小さい任意のm次元ベクトル${\bf k}$に対して、
$g({\bf y^0}+{\bf k}) = g({\bf y^0}) + Dg({\bf y^0}){\bf k} + \delta'(\bf{k})\qquad (c)$
ここで、$\lim_{{\bf k}\to {\bf 0}}\frac{\delta'({\bf k})}{\|{\bf k} \|}= 0\qquad \qquad \qquad (d)$
$g\circ f({\bf x^0}+{\bf h}) = g\Bigl(f({\bf x^0}+{\bf h})\Bigr)$
$\qquad$ 式(a)から、
$=g\Bigl(f({\bf x^0}) + Df({\bf x^0}){\bf h} + \delta({\bf h})\Bigr)$
$\qquad$ そこで、${\bf k(h)}=Df({\bf x^0}){\bf h} + \delta({\bf h}) \qquad (e)$
$\qquad$ とおくと
$=g\Bigl(f({\bf x^0}) + {\bf k(h)}\Bigr) = g\Bigl({\bf y^0} + {\bf k(h)}\Bigr) $
$\qquad {\bf h}$が零ベクトル近づくとき${\bf k(h)}$も零ベクトルに近づくので 式(c)を適用できて
$=g({\bf y^0}) + Dg({\bf y^0}){\bf k(h)} + \delta'({\bf k(h)})$
$=g\Bigl(f({\bf x^0})\Bigr) + Dg({\bf y^0}){\bf k(h)} + \delta'({\bf k(h)})$
故に、
$g\circ f({\bf x^0}+{\bf h})$
$=g\circ f({\bf x^0}) + Dg({\bf y^0}){\bf k(h)} + \delta'({\bf k(h)})$
$=g\circ f({\bf x^0}) + Dg({\bf y^0})\Bigl( Df( {\bf x^0}){\bf h} + \delta({\bf h})\Bigr) + \delta'\Bigl( {\bf k}({\bf h}) \Bigr)$
$=g\circ f({\bf x^0}) + Dg({\bf y^0})Df( {\bf x^0} ){\bf h}+Dg({\bf y^0})\delta({\bf h})+\delta'\Bigl({\bf k}({\bf h})\Bigr) $
$\qquad$ ここで、$\epsilon({\bf h}) \triangleq Dg({\bf y^0})\delta({\bf h})
+ \delta'\Bigl({\bf k}({\bf h})\Bigr)\qquad \qquad (f)$
$\qquad$ とおくと、
$=g\circ f({\bf x^0}) + Dg({\bf y^0})Df({\bf x^0}){\bf h} + \epsilon({\bf h})$
故に、
$g\circ f({\bf x^0}+{\bf h})=g\circ f({\bf x^0}) + Dg({\bf y^0})Df({\bf x^0}){\bf h} + \epsilon({\bf h})\qquad \qquad (g)$
もし
$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|} = 0 \qquad \qquad (g)$
が成り立てば定理6から、関数$g\circ f$は、点${\bf x^0}$で微分可能で、その導値は$Dg({\bf y^0})Df({\bf x^0})$であることが分かる。
式(g)を示そう。
$\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|}=\frac{\|Dg({\bf y^0})\delta({\bf h})
+ \delta'\Bigl({\bf k}({\bf h})\Bigr) \|}{\|{\bf h}\|}\qquad $ (式(f)利用)
$\leq \frac{\| Dg({\bf y^0})\delta({\bf h})\|+\|\delta'\Bigl({\bf k}({\bf h})\Bigr) \|}{\|{\bf h}\|}\qquad $(ベクトルの和のノルムの性質を利用)
$\qquad $ ここで、行列のノルムとして、ベクトルのノルムから誘導されたノルムを用いると、
$\qquad \| Dg({\bf y^0})\delta({\bf h})\| \leq \| Dg({\bf y^0})\|\|\delta({\bf h})\| $ なので
$\leq \| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}$
故に
$\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|}\leq \| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}\qquad \qquad (h)$
この式の右辺の第1項は、極限$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}$をとると0になる(式(b)より)。
第2項は、
1) もし${\bf k}({\bf h})\neq {\bf 0}$ならば、
$\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}
= \frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf k}({\bf h})\|}
\frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}$
$= \frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf k}({\bf h})\|}
\frac{\|Df({\bf x^0}){\bf h} + \delta({\bf h}) \|}{\|{\bf h}\|}$
$\qquad \lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}} \|{\bf k}({\bf h})\|
=\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\|Df({\bf x^0}){\bf h} + \delta({\bf h})\|=0$ であり
$\qquad \frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}=\frac{\|Df({\bf x^0}){\bf h} + \delta({\bf h}) \|}{\|{\bf h}\|}$
$\qquad \leq \frac{\|Df({\bf x^0})\|\|{\bf h}\| + \|\delta({\bf h}) \|}{\|{\bf h}\|} = \|Df({\bf x^0})\|+\frac{\|\delta({\bf h}) \|}{\|{\bf h}\|} \to \|Df({\bf x^0})\| \quad ({\bf h} \to {\bf 0})$
$\qquad $ なので、
$\qquad \|{\bf h}\|$が小さいとき、 $\frac{\|{\bf k}({\bf h})\|}{\|{\bf h}\|}$ は有界(ある正数M以下)である。
故に、
$0 \leq \lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}$
$\leq \lim_{{\bf k}({\bf h}) \to {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{ \| \delta'\bigl({\bf k}({\bf h})\bigr)\| }{\|{\bf k}({\bf h})\|}M = 0\qquad $(式(d)より)
故に
$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0},{\bf k}({\bf h}) \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}=0$
2) もし${\bf k}({\bf h}) = {\bf 0}$ならば、
$\|\delta'\bigl({\bf k}({\bf h})\bigr)\|= \|\delta'({\bf 0})\| = 0$なので、
$\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|} = 0$
この2つを合わせると、
$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}=0$
故に、式(h)から、
$\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\frac{\|\epsilon({\bf h})\|}{\|{\bf h}\|}
\leq
\lim_{{\bf h} \to {\bf 0},{\bf h} \neq {\bf 0}}\Bigl(\| Dg({\bf y^0})\| \frac{\|\delta({\bf h})\|}{\|{\bf h}\|}+\frac{\|\delta'\bigl({\bf k}({\bf h})\bigr)\|}{\|{\bf h}\|}\Bigr) = 0$
式(g)が示せた。
証明終わり。
${\bf R^n}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、
点${\bf a} \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_i,x_j}(\cdot)$ が存在し、
かつ、点${\bf a}$ で連続ならば、
1)導関数$f_{x_j}(\cdot)$は、点${\bf a}$ で変数$x_i$ に関して偏微分可能で、
2)$f_{x_j,x_i}({\bf a}) = f_{x_i,x_j}({\bf a})$
実数値の多変数関数の高階偏微分
(1)二階偏微分
定義 一階偏微分可能
$f({\bf x})$ を、n次元空間 ${\bf R^n}$の開集合$U$上で定義され、
実数に値をとる関数とする。
この関数が$U$上で、全ての変数に関する偏導関数
$f_{x_{i}}({\cdot})\quad (i=1,2,\cdots,n)$
を持つと仮定する。
この時 この関数を,U 上で一階偏微分可能であるという。
定義 二階偏微分係数
もし、点${\bf x^0}(\in U)$ で、偏導関数$f_{x_{i}}(\cdot)\bigl(\frac{\partial f}{\partial x_i}(\cdot)とも書く\bigr)$が、変数$x_{j}$に関して偏微分可能の時、その偏微分係数を$f_{x_i,x_j}({\bf x^0})\bigl(\frac{\partial ^{2}f}{\partial x_j\partial x_i}({\bf x})とも書く\bigr)$と表わす($i,j=1,2,\cdots,n $ )。
物理学や他の数理的分野で、
2つの変数 $x_{i}とx_{j}\quad (i\neq j)$ に関する偏微分の順番を交換したとき、
偏微分係数が変わるか、否かが問題になることが起こる。
定理8
${\bf R^n}$の開集合Uで定義された一階偏微分可能な実数値関数fに対し、
点${\bf a} \in U$ の開近傍W(注参照)で
$ \qquad \qquad f_{x_i,x_j} \ f_{x_j,x_i}$
が共に存在し、${\bf a}$において共に連続ならば、
$ \qquad \qquad f_{x_i,x_j}({\bf a}) = f_{x_j,x_i}({\bf a})$
(注)Wは点${\bf a}$を含む開集合で、$W \subset U$ であること。
この定理は次の定理の特殊な場合なので証明は略す。
定理9
${\bf R^n}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、
点${\bf a} \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_i,x_j}$ が存在し、
かつ、点${\bf a}$ で連続ならば、
1)偏導関数$f_{x_j}$は、点${\bf a}$ で変数$x_i$ に関して偏微分可能で、
2)$f_{x_j,x_i}({\bf a}) = f_{x_i,x_j}({\bf a})$
証明の記述を簡単にするために、次の2変数関数バージョンの証明をする。
定理9は、2つの変数$x_{i},x_{j}$以外の (n-2)個の変数は固定して考えるので、
実質的には2変数関数にかんする命題であり、
簡略バージョンの証明はそのまま定理9の証明になっている(ただし、記述が複雑になる)。
定理9d(定理9の2変数関数バージョン)
${\bf R^2}$の開集合$U$で定義された一階偏微分可能な実数値関数fに対し、
点${\bf a}=(a_1,a_2) \in U$ の近傍W($\subset U$)上で2階偏導関数$f_{x_1,x_2}$ が存在し、
かつ、点${\bf a}$ で連続ならば、
1)導関数$f_{x_2}$は、点${\bf a}$ で変数$x_1$ に関して偏微分可能で、
2)$f_{x_2,x_1}({\bf a}) = f_{x_1,x_2}({\bf a})$
証明;
点${\bf a}$を含む集合Wが開集合なので、充分小さな正数$\delta$を選べば、
点${\bf a}$を中心とする半径$\delta$の開球体$B_{\delta}({\bf a})$ はWに含まれる。
$B_{\delta}({\bf a}) \subset W \subset U$
今後はこの開球体の上で議論する。
$f_{x_2,x_1}({\bf a})\triangleq \lim_{h_1 \to 0,h_1 \neq 0}\frac{f_{x_2}(a_1+h_1,a_2)-f_{x_2}(a_1,a_2)}{h_1}$ が存在し、
$f_{x_2,x_1}({\bf a})= f_{x_1,x_2}({\bf a})$ であることを示せばよい。
(1)$ f_{x_2}(a_1+h_1,a_2) - f_{x_2}(a_1,a_2)
= \lim_{h_2 \to 0,h_2 \neq 0}
\frac{ f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2) }{h_2}
$ が成立する。
これは偏微分の定義から明白。
そこで、
$D(h_1,h_2)\triangleq f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2) $ と置くと、
$\lim_{h_1 \to 0,h_1 \neq 0}\frac{1}{h_1}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2}= \lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_1h_2} \qquad \qquad (a)$
が存在し、$f_{x_1,x_2}({\bf a})$ に等しいことを示せば定理は証明される。
(2)$\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a}) \qquad \qquad (b)$
である。
この部分が、この定理の証明の核心であり、多少の技巧を要する。
$D(h_1,h_2)$を生成するため次のような関数を導入する。
$\phi(t)\triangleq f(a_1+th_1,a_2+h_2)-f(a_1+th_1,a_2)\qquad \qquad (c)$
すると関数$\phi$は
$\phi(1)-\phi(0) = D(h_1,h_2)$をみたす微分可能な関数であることが容易に確かめられる。
すると、微分可能な関数に関する中間値の定理が適用出来るので、
ある正数$\theta_1 \in (0,1)$ が存在して、
${\phi}'(\theta_1 )=\phi(1)-\phi(0) = D(h_1,h_2) \qquad \qquad (d)$
ところが、$\phi$の定義から、
${\phi}'(t)=h_1f_{x_1}(a_1+th_1,a_2+h_2)-h_1f_{x_1}(a_1+th_1,a_2)\qquad \qquad (e)$
なので、式(d),(e)から
$ D(h_1,h_2)={\phi}'(\theta_1 )=h_1f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-h_1f_{x_1}(a_1+\theta_1h_1,a_2)$
$=h_1\Bigl(f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-f_{x_1}(a_1+\theta_1h_1,a_2)\Bigr) \qquad \qquad (f)$
ここで、定理の仮定により偏導関数 $f_{x_1}$ は開球体$B_{\delta}({\bf a})$上で,
変数 $x_2$ に関して偏微分可能なので、中間値の定理が適用できるため、
$f_{x_1}(a_1+\theta_1h_1,a_2+h_2)-f_{x_1}(a_1+\theta_1h_1,a_2)=h_2{f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) \qquad \qquad (g)$
を満たす、正数 $\theta_2 \in (0,1)$ が存在することが分かる。
式(g)を式(f)の右辺に代入すると
$ D(h_1,h_2)=h_1h_2{f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) $
故に $h_1h_2 \neq 0$ の時、
$ \frac{D(h_1,h_2)}{h_1h_2}={f_{x_1}}_{x_2}(a_1+\theta_1h_1,a_2+\theta_2h_2) $
2階偏導関数 ${f_{x_1}}_{x_2}$ は、点${\bf a}=(a_1,a_2)$で連続なので、
$\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a})$
が示せた。
(3)最後に
$\lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_1h_2} = f_{x_1,x_2}({\bf a}) \qquad \qquad (a)$
を示そう。
1) $\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2} = f_{x_2}(a_1+h_1,a_2)-f_{x_2}(a_1,a_2)$である。
何故ならば、
$ \frac{D(h_1,h_2)}{h_2} = \frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)-f(a_1,a_2+h_2)+f(a_1,a_2)}{h_2}$
$= \frac{\Bigl(f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)\Bigr)-\Bigl(f(a_1,a_2+h_2)-f(a_1,a_2)\Bigr)}{h_2}$
$=\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}-\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$
であり、
$\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}$と
$\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$は存在するので、
$ \frac{D(h_1,h_2)}{h_2} $の極限($h_2\to 0,h_2\neq 0)$ が存在し、
$\lim_{h_2 \to 0,h_2 \neq 0}\frac{D(h_1,h_2)}{h_2} = \lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1+h_1,a_2+h_2)-f(a_1+h_1,a_2)}{h_2}-\lim_{h_2 \to 0,h_2 \neq 0}\frac{f(a_1,a_2+h_2)-f(a_1,a_2)}{h_2}$
$=f_{x_2}(a_1+h_1,a_2) - f_{x_2}(a_1,a_2)$
が得られる。
2)次の補題が示されれば、
$g(h_1,h_2)\triangleq \frac{D(h_1,h_2)}{h_1h_2}$ と置くことにより
式(a)が得られる。
補題
2変数関数 $g(h_1,h_2)$ が、$\{(h_1,h_2)\in B_{\gamma }({\bf 0})|h_1h_2 \neq 0\}$上で定義されているとする。
もし、
$\lim_{(h_1,h_2)\to (0,0),h_1h_2\neq 0}g(h_1,h_2)= \alpha \qquad \qquad (h)$
と
$\lim_{h_2 \to 0,h_2 \neq 0}g(h_1,h_2)= \alpha (h_1) \qquad \qquad (i)$
が同時に成り立つならば、
$\lim_{h_1 \to 0,h_1 \neq 0}\lim_{h_2 \to 0,h_2 \neq 0}g(h_1,h_2)=\lim_{h_1 \to 0,h_1 \neq 0}\alpha (h_1)=\alpha$
である。
証明
収束の定義から、
任意の(小さな)正数 $\epsilon$ に対して、或る正数 $\delta(\epsilon)$ が存在して
$|h_1|\lt \delta(\epsilon),h_1\neq 0$ を満たす任意の実数 $h_1$ では
$|\alpha (h_1)-\alpha| \lt \epsilon$ が成り立つことを示せばよい。
仮定した式(h)から、
任意の正数$\epsilon$ に対して、これに依存して決まるある正数$\delta(\epsilon)$ が存在して
${\bf h}=(h_1,h_2)$ が
$\|(h_1,h_2)\| \lt \delta(\epsilon) $ を満たすならば、
$| \alpha - g(h_1,h_2) | \lt \frac{\epsilon}{2} \qquad \qquad (j)$
他方、仮定した式(i)から、
任意の非零の$h_1$に対して、ある正数$\delta'(h_1,\epsilon)$が定まって、
$ | h_2 | \lt \delta'(h_1,\epsilon) $ ならば
$ | \alpha(h_1) - g(h_1,h_2) | \lt \frac{\epsilon}{2} \qquad \qquad (k)$
非零で絶対値が $\frac{\delta(\epsilon)}{2}$ より小さい任意の実数$h_1$をとれば、
$ |h_2| \lt \min\Bigl(\delta'(h_1,\epsilon),\frac{\delta(\epsilon)}{2}\Bigr)$を満たす
任意の実数$h_2$に対して、
式(j)、(k) が同時に成り立つ(注参照)。
故に、
$ |\alpha - \alpha(h_1) | \leq |\alpha - g(h_1,h_2)| + | g(h_1,h_2)-\alpha(h_1)| \lt \epsilon $
これで、
任意の正数$\epsilon$ に対して、これに依存して決まるある正数$\delta\triangleq \frac{\delta(\epsilon)}{2}$ が存在して
$ |h_1| \lt \delta $ を満たす任意の非零数 $h_1$ に関して
$ |\alpha - \alpha(h_1) | \lt \epsilon $
が証明できた。
証明終わり。
(注)
$ |h_1| \lt \frac{\delta(\epsilon)}{2} \quad |h_2| \lt \frac{\delta(\epsilon)}{2}$ なので、
$\|(h_1,h_2) \| \leq |h_1| + |h_2| \lt \delta(\epsilon) $
が成り立ち、式(j)が成り立つ。
$C^{2}$級の関数
定義
定理10