氏か育ちか(1)スキーム~2030年のヒストリアンとビジョナリスト(13)

成功する人の原因を、「氏か育ちか」で、議論するスキーム、あるいは、フレームワークがあります。このスキームは、典型的な帰納法の失敗の例ですが、乱用が、非常に多く見られますので、「氏か育ちか」を例に、推論のスキームを論じます。

 

1)原型のスキーム

 

「原因ー>結果」というスキームが、「氏か育ちか」のスキームです。「ー>」の左辺が原因、右辺が結果という表記法を採用します。

 

仮説1:氏ー>社会的成功

仮説2:育ちー>社会的成功

 

「氏」、「育ち」は、最近の用語になじみませんので、言い直せば、以下になります。

 

仮説1:遺伝ー>社会的成功

仮説2:環境ー>社会的成功



2)ベイジアンスキーム

 

ベイズ統計では、次のスキームをとります。

 

仮説3:遺伝xw+環境x(1-w)ー>社会的成功

 

ここで、wは重みのパラメータで、エビデンスデータに基づいて調整します。

 

つまり、「氏か育ちか」という議論は不毛で、「エビデンスに基づくwの最尤推定値はいくらか」問題を書きかえるべきです。



wがあるという前提で、簡略化すれば、次の表記になります。

 

仮説3:遺伝+環境ー>社会的成功

 

仮説1と仮説2が、単一の原因から、結果を導き出しているのに対して、仮説3では、2つの原因から、結果が導かれます。

ここでは、原因は2つですが、3つ以上も可能です。ただし、表記が複雑になると読みにくくなるので、2つは、3つ以上の可能性を内包していることにします。

 

3)物理学のスキーム

 

一昔前に、科学とは何かという内容の小冊子を書いた、物理系の大家は、科学は1原因、1結果であるといっていました。データサイエンスからみれば、随分乱暴な議論です。

 

ニュートンの法則は、力とは運動を引き起こすものであるといいます。

 

ニュートンの法則:力ー>運動

 

このスキームを見ると、1原因、1結果の科学法則に見えます。



ー---------------------

 

第1法則(慣性の法則

    質点は、力が作用しない限り、静止または等速直線運動する(これを満たすような座標系を用いて、運動法則を記述する)。

 

第2法則(ニュートン運動方程式

    質点の加速度 a  は、そのとき質点に作用する力 F に比例し、質点の質量 m に反比例する。

    a = F/ m .

 

第3法則(作用・反作用の法則)

    二つの質点 1, 2 の間に相互に力が働くとき、質点 2 から質点 1 に作用する力 F 21  と、質点 1 から質点 2 に作用する力 F  12  は、大きさが等しく、逆向きである。

F12=F21.

ー---------------

 

ニュートンの法則は、学校の物理学では、法則として教えていますが、法則ではなく、定義が含まれています。

 

 たとえば、エルンスト・マッハポアンカレは、「ニュートンの第三法則(作用と反作用は相等しい)をまた実験的法則としてではなく、定義と見なし」ています。これは、第三法則を実証するエビデンスを得る実験が出来ないことを考えればわかります。

 

ニュートン力学の第2法則は、位置の変化量(加速度)は、力に比例するといいます。

しかし、これだけでは、物体の将来の位置を予測することはできません。この微分方程式を数値的に解くには、t=0の時の位置(初期値)が必要です。

これは、次のようにかけます。    

 

ニュートン力学の仮説:位置(t=0)+力ー>位置(t=t1)

この視点に立って、仮説3は、次の形に一般化できます。

 

仮説3G:(t=0の状態量)+(t>0の介入量)ー>結果

 

4)行動ターゲティング広告

 

広告の目的は、広告によって、その商品を購入してもらうことです。

 

次の仮説2のスキームを使えば、次のように書けます。

 

仮説2:環境ー>社会的成功

 

仮説2G:介入ー>介入の結果

 

仮説2G:広告ー>購入行動

 

このスキームでは、初期値の違いは無視されています。

 

つまり、仮説2Gの因果モデル(応答関数)では、初期値の影響は無視できると考えます。

 

一方、行動ターゲティング広告は、仮説3Gを採用します。

 

広告を表示し始める時間をt=0とした場合、(t=0の状態量)によって、介入方法をへんかさせます。

例えば、ネットでラーメンの検索をすると、その結果をつかって、(t=0の状態量)を検索している人は、ラーメンに、関心が高いとセットします。そして、ラーメンの宣伝を画面に表示します。

 

これは、ニュートン力学で言えば、運動法則は、(t=0の状態量)の影響を受けることに相当します。

 

仮説3G:(t=0の状態量)+(t>0の介入量)ー>結果

 

さて、仮に、仮説3Gのモデルが正しいとして、それを、計算して予測に使うことができるのでしょうか。

 

神嶌 敏弘氏によれば、このようなシステムが実装されたのは、1994年からです。

 

5)人間の限界

 

今までの科学的モデリングは、帰納法を重視して、(t=0の状態量)を無視してきました。しかし、これは、常識に反します。

 

教育では、(t=0で未知)の生徒に、授業をすることに意味はありますが、(t=0で既知)の生徒に、授業をするのは時間も無駄です。さらに、この間に、半分程度理解できている生徒もいます。こうなった場合、単に、教師のキャパシティの限界から、画一的な授業をしています。

 

教育に、クラウドシステムを導入すれば、この(t=0の状態量)の多様性に対応することができます。

 

推薦システムは、ニュートンの法則のように、絶対に成立しているような法則ではありませんが、(t=0の状態量)の多様性に対応できるために、劇的な効果があります。

 

この効果は、「仮説2G:介入ー>介入の結果」では、理解できないものです。

 

日経新聞には、学校に一人1台で導入したパソコンやタブレットを学校で持て余している事例が紹介されていました。

 

しかし、これは、「仮説2G:介入ー>介入の結果」のモデルから、抜けられなかった間違いが原因であると思われます。

 

ニュートン力学 wiki

https://ja.wikipedia.org/wiki/%E3%83%8B%E3%83%A5%E3%83%BC%E3%83%88%E3%83%B3%E5%8A%9B%E5%AD%A6

 

協調フィルタリング wiki

https://ja.wikipedia.org/wiki/%E5%8D%94%E8%AA%BF%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF%E3%83%AA%E3%83%B3%E3%82%B0

 

推薦システムのアルゴリズム 神嶌 敏弘

https://www.kamishima.net/archive/recsysdoc.pdf