6)確率と可能世界
反事実の論点を整理してみます。
6-1)サイコロの世界
偏りのないサイコロであれば、1の目がでる確率は、6分の1です。
6分の1の値を求める方法には、次の3つがあります。
第1は、同じサイコロを繰り返し振った記録をとります。
第2は、多数のサイコロをあつめて、1回ずつ振った記録をとります。
第3は、第1と第2の方法の繰り返しです。
多数のサイコロをあつめて、繰り返し振った記録をとります。
大数の法則は、第2と第3の方法に当てはまります。
しかし、全く偏りのないサイコロは、存在しません。
なので、第1の方法には、大数の法則は使えません。
第1の方法では、ベイズ統計を使って、サイコロの偏りを計測します。
第1の方法では、頻度主義は、ベイズ統計と比較したメリットがないので、頻度主義を使う可能性は少ないと考えます。
ここで、新しく、サイコロが1つ見つかったとします。
このサイコロの1の目が出る確率はいくつでしょうか、
各段の情報がなければ、このサイコロの1の目がでる確率は、第3の方法で求められた確率に一致すると考えます。
これは、新しいサイコロが、第3の方法で確率を求めたサイコロの母集団に含まれると仮定していることになります。
その判断は、主観です。
新しいサイコロが、第1の方法で確率を求めたサイコロに酷似していると判断すれば、第1の方法で求めた確率を採用することも可能です。
この判断も主観です。
この2つの判断に、優劣をつける客観的な基準はありません。
6-2)偏差値
大学受験の志望校選びには、模擬試験の偏差値を使います。
模擬試験の偏差値は、大学の入学試験のデータではありません。
また、偏差値は、正規分布に変換していますが、その変換は不正確です。
これは、正規分布以外の確率計算が難しかった時代のレガシーにすぎません。
乳がんのマンモグラフィーの陽性の識別率は、約80%ありますが、陽性でがんにかかっている確率は、1%程度です。ここには、識別率の問題があります。
偏差値の識別率は、非常に低いです。特に、偏差値の値が下がると、試験には意味はありません。
意味のない教科ごとの試験をやめて、論理的な文章の理解、数学の計算、簡単な英語の読解の総合試験を1つして、極値を除外すれば、それで十分と思われます。
逆にいえば、高等学校の卒業試験が、このレベルの客観的なデータを提供していれば、入学試験は不要です。
さて、以上のような問題を脇において、偏差値で、大学の入学試験の合否が推定できると仮定します。
これは、サイコロの例で言えば、第3の方法による大数の法則による確率を受け入れることになります。
この判断は、主観です。
模擬試験には、難易度のバラツキがあります。
ここでは、難易度のバラツキを無視できると仮定します。
第1の方法で、ある学生の大学の入学試験の合格確率を考えます。
ここでは、模擬試験の偏差値が、大学の入学試験の合格確率の代替指標であると仮定します。
ある学生が、数回の模擬試験をうけて、偏差値が向上したとします。
ベイズ統計では、偏差値の向上分がそのまま確率に転嫁されるわけではありませんが、偏差値(大学の入学試験の合格確率)は、向上します。
つまり、ここには、サイコロと同じ、第1の方法の確率か、第3の確率かという選択問題があります。
そして、その判断は、主観になります。
主観によって、想定される合格確率は大きく変化します。
第3の方法では、ある学生が、どの母集団に属するかという主観の判断が必要になります。
第1の方法のベイズ統計をとれば、この問題は回避できます。サイコロの例とは異なり、ここでは、第1の方法は、該当する学生を対象にしています。
つまり、「どの母集団に属するかという主観の判断」を回避できれば、問題の見通しがよくなります。
6-3)因果推論の反事実
因果推論の反事実は、「どの母集団に属するかという主観の判断」を回避する方法になっています。
頻度主義をとる限り、「どの母集団に属するかという主観の判断」は不可避です。
大数の法則は、偏りのある個別のサンプルには、無力です。
筆者は、「大数の法則は、個別のサンプルには、無力で使えない」と考えています。
しかし、「大数の法則には、実用上の価値はない」と書かれている統計学の教科書はないと思います。
ベイズ統計をつかう理由は、頻度主義とは異なった結果が得られるためです。
これは、頻度主義の理論が間違っていることを意味しません。
頻度主義は、「どの母集団に属するかという主観の判断」を検討の対象から排除して、形式的な客観主義を優先してきました。
間違っているのは、「どの母集団に属するかという主観の判断」になります。
「潜在的な結果」とは、反事実のYと、事実のYが、同じ客観的事実と認めることでした。
これは、可能世界を受け入れることでもあります。
これは、大胆な仮定ですが、この仮定を受け入れれば、「どの母集団に属するかという主観の判断」を回避することができます。
これから、EBPMを受け入れれば、今までの推定結果が覆されることがわかります。
因果推論の科学の革命が、破壊的である理由は、「今までの推定結果が覆される」点にあります。そして、これは、因果推論の科学が受け入れにくい原因にもなっています。