注:これは、ジューディア・パール、ダナ・マッケンジー「因果推論の科学―「なぜ?」の問いにどう答えるか」のコメントです。
(60)反事実とうまい話
1)ヒュームの反事実
ヒュームは、ある個人(個体)が選択できる事実は1つしかないので、「もし、XXしなかったら」と「もし、XXしたら」という推論を比較する場合、片方が事実になれば、もう片方は、反事実になると考えました。
この問題に対する解決策には、2種類があります。
第1は、ある個人(個体)を問題にすることを放棄して、因果モデルは、ある個人と似たようなグループに対して成りたつという解釈です。
大学入試の模擬試験をうけて、悪い判定結果が出た場合、この結果は、ある個人と似たようなグループに対して成りたっています。
実際の入学試験までの間に、勉強すれば、あるいは、勉強をさぼれば、ある個人は、別のグループに属するようになります。
統計解析の結果は、こうした可能性を否定していません。
統計解析の場合には、その個人(個体)が属するグループが変わってしまうと、解析結果が使えなくなります。
このような問題点はありますが、反事実に対して、データを補間する必要はありません。
第2は、あくまで、ある個人(個体)を問題にする場合です。
これを、ルーピン流にいえば、欠損データは「因果推論の根本的な課題」になります。
反事実に対して、データを補間する必要があります。
2)うまい話
パール先生は言います。
<
うまい話には必ず裏がある。(ルービンの方法で)こういう結果がえられたのは、その背後に強固な前提があったからだ。観察された変数の間に因果関係があると主張しただけでなく、関数関係が線形であることも仮定したのである。
>(pp.426-427)
一般に、薬の効果はRCTで推測できます。
RCTは、同質のグループを対象にした因果推論です。
一方、裁判で、特定の患者への薬の投与が問題になった場合には、RCTのような同質のグループを対象にした因果推論は使えません。
この場合には、反事実を正面から扱える手法が必要になります。
「因果推論の科学」の「第8章反事実」でとりあげられている例題は、全て、同質のグループを対象にした因果推論が使えない場合です。
一方、ルービンの方法を解説している書籍には、同質のグループを対象にした因果推論が使える場合にもかかわらず、反事実のルービンの手法を使っている例題が見られます。
筆者は、同質のグループを対象にした因果推論が使える場合に、反事実のルービンの手法を使うメリットは無いと考えます。
その理由は、パール先生が言うように、ルービンの方法は、うまい話だからです。
反事実を正面からあつかう手法では、データ数が極端に少なくなるので、ノイズに対して、非常に脆弱になります。また、線形関数などかなり無理な仮定を置いています。
同質のグループを対象にした因果推論であれば、データ数を増やすことで、ノイズに対して、頑強になります。
ただし、データ数を増やすと、同質性の前提が緩くなっていきます。
つまり、データ数と同質性の間には、トレードオフの関係があります。
筆者は知らないのですが、このトレードオフのベストポイントを推定する理論があるのかも知れません。