"機械学習","信号解析","ディープラーニング"の勉強

読者です 読者をやめる 読者になる 読者になる

HELLO CYBERNETICS

深層学習、機械学習、強化学習、信号処理、制御工学などをテーマに扱っていきます

理系大学入学後にどん詰まる「ε-δ論法」について

 

 

f:id:s0sem0y:20170505074213p:plain

 

 

はじめに

大学に入学して新生活を始めた方もたくさんいるでしょう。

そこで理系大学生が微積分(あるいは解析学)を学び始めて、最初に詰まるとされる悪名高き「ε-δ論法」について分かりやすく解説したいと思います。

 

ε-δ論法 

ε-δ論法とは要するに、以下のように極限の定義を行うことです。

 

\large \displaystyle \lim_{x→a}f(a) = b

\large \displaystyle \leftrightarrow ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-a \right| \leq \delta \rightarrow \left| f(x)-b \right| \leq \epsilon

 

これで理解ができた人は、もうこれ以上記事を読む必要はありません。

 

ちゃんと分かりやすく直感的に説明したいと思います。とは言っても、そもそも極限を直感的にではなく厳密に定義するために生まれてきたものですから、多少の記号の意味を理解する必要はあります。

 

しかし、どのような必要に迫られてこんなことしなければならなくなったのか、つまり事の経緯とそのアイデアを抑えれば、十分に理解は可能です。

 

ε-δ論法が難しく感じる理由

おそらく大学一年の時点で学ぶ微積分、特に一変数の微積分においてはほとんど恩恵がありません。このことが、「結局あいつはなんだったんだ?」となってしまう理由かと思われます。あとは単純に、いきなり見慣れない記号が現れてそもそも読み方がわからない、まるで異国語のように感じてしまうためというのもあるでしょう。

 

ともかく、このアイデアの旨味と、記号を知りさえすれば本来理解は容易です。

 

ε-δ論法の解説

直感的な極限の話

とにかく以下の式の意味がよくわからないというところを解消したいと思います。

 

\displaystyle \lim_{x→a}f(a) = b

\displaystyle \leftrightarrow ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-a \right| \leq \delta \rightarrow \left| f(x)-b \right| \leq \epsilon

 

極限\lim_{x→a}f(x)=bというのは要するに、xを限りなくaに近づけたらf(x)は限りなくbに近づきますよという話です。例えば当たり前の例として

 

f(x)=x^3 - 2x

 

のとき

 

\lim_{x→2}f(x)

 

を求めよ

 

 

という問題が出た場合には、誰でも簡単に解けてしまうでしょう。多分、たいていの人がx=2を代入することによって8-4=4この問題を解きます。そして答えはそれであっています。x→2と近づくに連れて、確かにf(x)→4となります。間違いありません。

 

私達は、この問題の関数f(x)=x^3 -2xをある程度簡単に頭に思い浮かべることができます。思い浮かべた時、少しずつx2近づけたらどんなふうな値になるのかなんてすぐに分かってしまいます。

 

 

ともかく、この手のわかりきった関数に対しては、極限を取ることは、めっちゃくちゃ近づけることであり、ほとんど代入をすることと変わりません。

 

ところがε-δ論法になると、このことを言うためにどうするかというと

 

ε-δ論法での話

上記の極限の結末をε-δ論法ではどのように表記するかというと(f(x)=x^3 - 2xという設定で話をします)

 

\lim_{x→2} f(x) = 4

 

\leftrightarrow

 

\displaystyle ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-2 \right| \leq \delta \rightarrow \left| f(x)-4 \right| \leq \epsilon

 

となります。

どうでしょうか、全く意味不明です。

 

論法の意義

まず、第一に何を主張しようとしているのかを説明します。

 

 A \leftrightarrow B

 

というのは「AとBは同値です」という意味であり、「Aを主張することと、Bを主張することは同じことですよ」と言っています。どっちを調べても構いませんということです。どっちかを知ればもう一方のことも完全に把握できたということになります。

 

数学の問題を解くときによくやるのが同値変形です。問題文の内容を式に起こして、解きやすい形に変形していきますよね。その変形された問題を解けたら、もともとの題意に関する解答もできたと結論できます(受験でもやってきたはずです)。

 

\lim_{x→2} f(x) = 4

 

という主張をすることが困難である場合に、

 

\displaystyle ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-2 \right| \leq \delta \rightarrow \left| f(x)-4 \right| \leq \epsilon

 

を主張できれば、肩代わりができるということです。

しかし、まあ、どう考えても変形先の方が複雑だと思うことでしょう。上の式を主張するほうが明らかに簡単です。しかし、それは問題が簡単だからなんです。今回は直感的な例で見たように、明らかにそうだろうと言い切れます。しかし、関数が複雑になるにつれ(特に多変数になると)、グラフを想像するのは困難になり、本当にそうであるのかを言い切れなくなってきます。代入操作が一致するとは限らなくなってきて、頼れるこれと言った操作がなくなってしまうのです。

 

そこで、極限のことを調べるために、頼れる決まりきった操作を作ってしまおうと言うのが「ε-δ論法」の狙いです。1年生で学ぶうちに、これが頼れるやつだと思える日は多分来ないです。しかし、ε-δ論法を使うと、いずれ問題によっては解きやすいと感じられる場面が来るはずです(いや、工学の私には訪れませんでしたが…)。

 

論法の主張

まずは、

 

\displaystyle ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-2 \right| \leq \delta \rightarrow \left| f(x)-4 \right| \leq \epsilon

 

の主張するところは

 

\lim_{x→2} f(x) = 4

  

と全く同じですということを把握しておきましょう。下の主張(極限値は4になる!という主張)が定かではないときに、代わりに上の主張ができれば良いという発想です。

 

とりあえず1つ1つ記号を整理していきます。

∀\epsilon \gt 0」は「0より大きい任意のεで」という意味

∃\delta \gt 0」は「0より大きいとあるδが存在」という意味

∀\epsilon \gt 0,∃\delta \gt 0」は「任意のεに対して、あるδが存在して」

になります。そして後ろに続くのは「●●ならば××」という命題です。この命題に着目しましょう。上記の記号の意味を踏まえて、

 

\displaystyle ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-2 \right| \leq \delta \rightarrow \left| f(x)-4 \right| \leq \epsilon

 

というのは簡潔に述べれば

 

x2の距離がとある大きさの\delta以内ならば、f(x)4の距離は任意の\epsilon以内に収まる。

 

という命題になっています。これが成り立っていれば、\lim_{x→2} f(x) = 4が主張できるという流れです。さて、ここで元々主張したい極限の話と\delta,\epsilonの役割を考えると、実は以下のように言い直せます。

 

x2の距離が\delta以内のときに、f(x)4の距離はすっごくめちゃくちゃ小さな\epsilon以内に収まる。

 

結局、言っていることは

 

x2に(ある程度)近づいたとき、f(x)4はかなり近づいている。

 

ということです(やっぱり普通の極限の話でした)。これを厳密に書き下したのがε-δ論法です。

 

流れを整理

当然、厳密な極限の定義をするために意図的に編み出されたものであるため、本来の歴史的な流れは

 

\lim_{x→2} f(x) = 4

x2に(ある程度)近づいたとき、f(x)4はかなり近づいている。

x2の距離が\delta以内のときに、f(x)4の距離はすっごくめちゃくちゃ小さな\epsilon以内に収まる。

x2の距離がとある大きさの\delta以内ならば、f(x)4の距離は任意の\epsilon以内に収まる。

\displaystyle ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-2 \right| \leq \delta \rightarrow \left| f(x)-4 \right| \leq \epsilon

 

となっています。この最初と最後のギャップが凄まじすぎるあまりに意味不明になってしまうのです。

 

ポイントと言えば、「任意のε」というのは結局のところ「非常に小さなε」と解釈していいということです。そしてεに対して「とあるδ」は何でも良いのです。小さいεに挟まれた式を成り立たせることのできるような適当なδを1つ見つければ良いのです。

例えば、小さなε_0に対して、右辺を成り立たせられるようなδ_0が見つかればいいのです。そして、更に厳しい小さなε_1が迫ってきたらそれに対するδ_1が見つかれば良いのです。

 

そうすれば、いつでも「とあるδ」で「任意のε」に対応してやることができます。どんなεが来ようとも、不等式を成り立たせられるδが存在することを言ってやれば良いということになります。

不等式をごちゃごちゃ弄くって、その不等式が成り立つようにδを求めること、すなわち「δ=g(ε)」のような形で、δがεの関数として求まることで証明が完了します(実はこれが意外と面倒でコツがいるのですが)。

 

大抵の場合、εが小さくなるに連れてδも小さいものを見つけなければなりません(極限のことを想像すれば当たり前です)。

従って、

 

δ=kε

 

などと、εに連動して小さくなる関数を仮定したりします。

 

大抵の場合、教科書は技巧的な仮定を置いていたりしますが、ともかくやろうとしているのは、「どんな小さなεが来ても、それに対応するδを準備出来ますよ」ということの証明です。逆に極限が成り立たないケースでは、不等式を変形していった結果、その不等式を成り立たせられるδが見つからないという結論が得られます(つまり適当なδでεの不等式を成り立たせることができないという結論)。

 

最後に


\large \displaystyle \lim_{x→a}f(a) = b

\large \displaystyle \leftrightarrow ∀\epsilon \gt 0,∃\delta \gt 0 : \left| x-a \right| \leq \delta \rightarrow \left| f(x)-b \right| \leq \epsilon

 

さて、これの意味が抵抗無く入ってくるようになったでしょうか(具体的に解く練習は教科書などでしてみてください。工学系はほとんど使う機会無いでしょうけども)。またε-N論法というものもあり、概念は似たようなものです。非常に小さなεに対応できる自然数Nを見つけることになります(こちらが先か?)。

 

 

 

ともわれ理系大学の新入生(物理や工学系)の人には以下がおすすめです。

 

物理数学の直観的方法―理工系で学ぶ数学「難所突破」の特効薬〈普及版〉 (ブルーバックス)

物理数学の直観的方法―理工系で学ぶ数学「難所突破」の特効薬〈普及版〉 (ブルーバックス)

 

 

 

数学自体をしっかりやっていくなら、これが良いのかな(数学科の気持ちは分かりません)。 少なくとも上記より内容はハイレベルで、解析を全般できます。(もちろん教科書が一番ですが)

現代の古典解析―微積分基礎課程 (ちくま学芸文庫)

現代の古典解析―微積分基礎課程 (ちくま学芸文庫)

 

 

 

大学学部生におすすめ記事

s0sem0y.hatenablog.com

s0sem0y.hatenablog.com

s0sem0y.hatenablog.com