介入型モデルの世界観~帰納法と演繹法をめぐる考察(7)

介入型モデルの世界観

世界がどのように構成され、どのように認識されているのかということは、世界観のモデルになります。

コロナ対策も実は、特定の世界観のモデルの上に構築されています。世界観のモデルは、自然にあるものではなく、演繹法でしかつくれません。なぜなら、モデルは、世界を見る枠組みだからです。

しかも、使える世界観のモデルは、演繹のバトルに生き残ったモデルだけです。世界をみる虫眼鏡Aと虫眼鏡Bがあったとします。虫眼鏡は、演繹によってしかつくれません。AとB2つの虫眼鏡のどちらの性能が良いかは、観測対象などの条件によって異なりますが、条件をそろえれば、性能比較は可能です。

結局、使い物にならない、世界観のモデルからは、まともなコロナ対策も導き出せません。

帰納法演繹法の2分法にはあまり意味がないと申し上げましたが、その理由は、世界観の構成するモデルが、既に、2分法に対応していないからです。ここでは、唯一の正解があるのではなく、いくつかの世界の構成モデルがあります。今回は、典型的な世界観の構成モデルである介入型のモデルを紹介します。なお、介入モデルは、実験の一般化にもなっています。

図1が、観察・帰納モデルと介入モデルの比較です。

観察モデルは、データを単純に入手できる、データの不完全性をあまり意識しない作りになっています。簡単に言えば、データが、不完全であれば、取り直せばよいという考えかたです。実験であれば、やり直せばよいという考え方です。

介入モデルでは、現象は時間と共に変化します。場合によっては、川の流れのように空間的に変化すると考えます。ここで、t(n)とt(n+1)は時間の進展を示します。この時間の間に、介入を行い、介入前後で、データをとって、偏差をとります。t(n)とt(n+1)の間の時間が短ければ、介入以外の効果で、偏差が生ずる確率は小さいと考えます。ランダム化試験のように、より厳密に比較をする場合には、図2のような、介入のない場合の偏差も測定して、補正をします。ここでは、t(n)とt(n+1)は時間の進展の間に、観測するデータの変化は緩やかであるという仮定がおかれています。

更に、展開すると、図3のように、介入時に得られるものは、モデルの一部の部品(Δモデル)です。これをくみたてて、次のステップで、モデルをつくります。

モデルは不変ではなく、介入のたびにΔモデルを得て、それを使って微調整していきます。ここでは、データは常に不完全で、モデルも不完全であることが前提とされています。

前回の一夜漬けの学習計画の問題点を例示しましたが、図3のようなモデルを順次ブラッシュアップしていく方法は、毎日学習して、次第に、学力をつけていく過程にそっくりです。実際に、この手順は、機械学習で使われています。

ここで、大切なことは、現在のデータサイエンスの世界観は、こうした学習過程とそっくりであるということです。ニュートンアインシュタインは、神様が作った公式を追求するという世界観で、物理学を進めたと思います。実際に、この世界観は、前世紀の自然科学では主流でした。良い実験をして、いつか、きっちり、精度の高いデータを得ることができれば、真理に到達できるはずだという世界観です。今世紀に入って、こうした世界観は、おもに、次の3点から、否定されています。

  • 統計的、データサイエンスの世界観では、データは常に不十分で、永久に足りることはありません。データがばらつくのは、確率現象だからで、計測を改善しても、ばらつきはなくなりません。

  • 生物学の遺伝子の解析は、生物は、主にDNAのコピーで設計され、コピーミスがある確率で発生します。これは、決定論では、説明できません。

  • 生態学は、地球全体が、因果の織物になっていることを解明しました。ある変数を変化させたときに、生ずる影響を全て事前に予測することは原理的にできません。

このような、制約の中で、演繹法で、世界観のモデルを作成して、データを得ることで、真理に到達できるという信念が、データサイエンティストにはあります。

最後に、問題は、こうした新しい世界の科学観は、いまだ、普及せず、観察・帰納モデルは、依然として、幅を利かせている点にあります。

 

f:id:computer_philosopher:20210118205422j:plain

図1 観察・帰納モデルと介入モデル

 

f:id:computer_philosopher:20210118205441j:plain

図2 介入モデル(介入のない場合)

 

 

f:id:computer_philosopher:20210118205503j:plain

図3 介入モデルの更新