因果モデル構造の演繹法と帰納法の罠
帰納法と演繹法は対比的に使われることの多い用語ですが、実際には、それほど、簡単ではないことが多いです。
物理学と帰納法の話を入れるつもりで、話が伸びていますが、あまり、教科書に書かれている杓子定規の解釈を繰り返しても面白くないと思うのが、その理由の一つです。
帰納法と演繹法を対比的に論じても、あまり、有効な知見は得られないので、今回は、因果モデルについて考えます。物理学が、もたらした理論は、「1原因ー1結果のモデル」と言われています。(注1)
「1原因ー1結果モデル」は、多くの人にとっては、理解しやすく、バイアスを生じやすい原因になっています。
図1に2種類の因果モデルの概念を示します。
具体例を示します。
食事をするとコロナウィルスがうつるというのは、「1原因ー1結果モデル」です。
これは、次のように図式化できます。
原因:食事をするー>結果:コロナウィルスにかかる
しかし、これは、明らかな、間違いです。なぜならば、2年前に、「食事をした結果、コロナウィルスにかかった人」はゼロだったからです。つまり、「1原因ー1結果モデル」は正しくないのです。
食事をして、コロナウィルスに感染するためには、恐らく、次の条件が必要です。
-
誰かと一緒に食事をする
-
一緒に食事をした人がコロナウィルスに感染している
-
食事中に感染した人から、コロナウィルスをもらっている
-
コロナウィルスをもらった後で、有効な消毒で、ウィルスの排除ができなかった。
これらの条件のうち、どれか1つでも、欠けていれば、コロナウィルスに感染することはありません。
問題は、これらの条件はどのように導き出されたかという点です。これらの条件は、演繹法によって、導き出されています。演繹法は、帰納法を併用しなければ、事実によって検証されていません。実際に、筆者は、これらの条件を一つ一つ、変化させて、実験して確かめたわけではありません。また、実際にそのような実験をすることは、倫理的に許可が得られるとも思われません。しかし、筆者は、この条件は、おおむね正しいと確信しています。少なくとも、
原因:食事をするー>結果:コロナウィルスにかかる
の「1原因ー1結果モデル」よりは、ずっと、ましと思っています。
一般には、次のように考えられているのではないでしょうか。
しかし、筆者は、この俗説は間違いであると確信しています。その理由は、次の2点です。
-
帰納法の罠:因果モデルのような、演繹による事実関係のモデルなしに、帰納法を適用しても正しい結論には達しません。特に、統計の訓練を受けていない人は、1原因ー1因果モデルが居心地がいいので、直ぐに、何でも、それにあてはめたがります。これを回避するには、常にモデル構造を意識して、「1原因ー1因果モデル」に落ち込まない努力をする必要があります。演繹は、不確かであるという定説は、実験科学が出てきて広まった俗説です。実験と帰納法で解決できる問題は、多くの問題のごく一部に限定され、しかも、モデル構造に、演繹を含まないと、帰納法がうまく働きません。
-
伝統的な演繹法:それでは、帰納法以外にどのような手法があるといえば、アリストテレス以来の演繹法があります。アリストテレスの提示した演繹法は思い付きではありません。アリストテレスの演繹法は、演繹のバトルです。複数の演繹を戦わせて、まともな、推論だけを生き残らせる方法です。筆者が、上記のコロナウィルスの食事伝播モデルが、演繹であるが正しいと思っている理由は、これが、筆者の頭の中のバトルで生き残ったモデルであり、他の場でバトルしても、直ぐに負けて敗退することはないと考えているからです。
データサイエンスでは、ニューラルネットを使う場合を除いては、モデルの構造を演繹でつくります。データによる機能は、その後で始まります。
コロナウィルスについては、毎日、洪水のような情報が入ってきます。しかし、その90%以上は、「1原因ー1結果モデル」による帰納法によるもので、将来予測や、問題解決には、役に立ちません。問題の解決は、演繹によって、適切な予測と問題に対処することによってのみ可能になります。そこでは、予測と意思決定は分離できません。したがって、演繹法は価値判断を含んだものになります。
注1:
物理学が、どこまで、因果モデルかという点については、疑問もあります。特に、時間の扱いのついて、その問題が指摘されることがありますが、ここでは、深入りしないことにします。
注2:
ここでは、より複雑な交絡条件は、省略しています。