TETRADとClark Glymour

日本語版のウィキペディアの「統計的因果推論」には、「20世紀後半から、ジューディア・パールや、ドナルド・ルービンらによって発展を遂げた」と書かれています。

 

「統計的因果推論」の和書には、パール流とルービン流があると説明されていて、ほとんどの和書は、ルービン流であると断わっています。

 

パールの「因果推論の科学」(p.35)には、「因果モデルがなければ、行動や介入の影響についての情報は、対照実験の手法に則ってデータを集めていない限り、生のデータからは全く得られない」と書かれています。

 

観察で得られたデータと介入で得られたデータは、全く異なります。介入によって得られたデータでは、交絡因子の影響が小さくなりますが、観察によって得られたデータは、交絡因子の影響まみれです。交絡因子の影響(ノイズ)の大きなデータは使えません。

 

トランプ関税ショックで、日本経済の沈没がほぼ確実になったからでしょうか、WEBには、なぜ日本が技術競争力がなくなったかという解説記事があふれています。

 

「なぜ日本が技術競争力がなくなったか」という疑問に対する解答は、「このように介入していれば、技術力低下がなかったはずである」という主張になります。

 

パールに言わせれば、「行動や介入の影響についての情報は、生のデータ(観察研究)からは全く得られない」ので、解説記事は、間違った方法論をとっていることになります。

 

この判定基準をとれば、99%の解説記事は、読むに値しないことになります。

 

因果モデルの要点は、介入をしないでも、観察データから、因果推論が可能な特殊な条件を探索する点にあります。

 

そのためには、因果ダイアグラムが必須の条件になります。

 

問題は、因果ダイアグラムの備えるべき条件です。

 

パールは、ベイジアンネットワークは、矢印(向き)の情報を持たないので、因果ダイアグラムにはならないと主張します。

ところが、カーネギーメロン大学のClark Glymourは、ベイジアンネットワークから因果モデルを探索することは可能であると考え、TETRADというパッケージを公開しています。

 

英語版のウィキペディアの「因果推論の科学 The Book of Why」には、「因果推論の科学」に対する評価も書かれてます。

 

レビュー

「因果推論の科学y」の科学的背景、抜粋、正誤表、37件のレビューリストは、Judea Pearlのウェブページに掲載されています。

 

「因果推論の科学」は、ニューヨーク・タイムズ紙でジョナサン・ニーによって書評された。書評は肯定的で、ニーは本書を「啓発的」と評した。しかしながら、本書の一部は「難解」であり、「著者の方程式への愛着を共有しない読者には必ずしも完全に理解できるわけではない」と述べている。

 

ティム・モードリンはボストン・レビュー誌で本書を賛否両論の批評で「因果分析の最新動向を概観した素晴らしい書」と評した。しかし、モードリンは「因果の梯子」の別の段として「反事実的」なものが含まれていることを批判し、「反事実的」なものは因果的主張と非常に密接に絡み合っているため、因果的に考えながら反事実的に考えないということは不可能である」と述べている。また、モードリンは自由意志に関するセクションの「不正確さと哲学文献への精通不足」を批判している。最後に、彼はパールと同様の考えを展開した複数の科学者(クラーク・グリモアを含む)の研究を指摘し、「パールがこの研究を知っていれば、文字通り何年もの労力を節約できただろう」と主張している。パールは反論の中で、当時はこの研究をよく知っていたと述べている。

 

ゾーイ・ハケットはChemistry World誌に寄稿し、「因果推論の科学」に肯定的なレビューを与えたが、「本書で提示される難解な統計的問題を理解するには、集中力と勤勉な努力が必要である」という但し書きを付けた。レビューの結論は、「本書は科学哲学を真剣に学ぶ学生にとって必読書であり、学部1年生の統計学の授業では必読書となるべきである」と述べている。

 

リサ・R・ゴールドバーグは、アメリカ数学会の通知に詳細な技術的レビューを寄稿しました。>

 

レビューの中の問題は、モードリンの指摘にあります。

 

第1に、<「反事実的」なものは因果的主張と非常に密接に絡み合っているため、因果的に考えながら反事実的に考えないということは不可能である」>という部分です。

 

パールは、「情報の表現が情報の獲得より優先する」(p.66)と言います。

 

パールは、因果推論の言語ではなく、統計の言語では、因果関係を論じることはできないと考えます。

 

モードリンは、統計の言語でも、因果関係を部分的に考えていることになると主張しています。



第2は、クラーク・グリモアの研究です。クラーク・グリモアは、ベイジアンネットワークにも、因果推論の情報が含まれていると考えています。つまり、「情報の表現が情報の獲得より優先する」とは、必ずしも言えないという立場と思われます。

「因果推論の科学」が難解になる理由は、パールが、因果推論の問題は、統計学の言葉では表現できないと主張している点にあります。

 

「因果推論の科学」では、数式としての因果推論の言語を最小におさえているため、かえって難解になっている部分もあります。

 

数式だらけのパールの「入門統計的因果推論」の方が、わかりやすくなっている部分もあります。

 

たとえば、因果ダイアグラムは、「入門統計的因果推論」では、グラフ理論の一部として説明されています。因果ダイアグラムは、数学の言語です。「因果推論の科学」では、数学の言語を避けているので、曖昧な表現になっている部分もあります。

 

カーネギーメロン大学のワークショップのパワーポイントの図を引用します。




図1 因果と統計



 

<<

Center for Causal Discovery Summer Workshop - 2015

https://www.ccd.pitt.edu/wp-content/uploads/2015/07/CCD_Summer_Course_Day1_morning.pdf

>>

 

当たり前ですが、カーネギーメロン大学は、パール流とは言わずに、因果グラフモデル(因果ダイアグラム)といいます。

 

一方のルービン流も、潜在的な結果といっています。

 

「パール流とルービン流」は、日本でしか通用しない表現のようです。

 

TETRADは以下に情報があります。

 

<<

TETRAD

https://www.cmu.edu/dietrich/philosophy/tetrad/

>>

 

和書の「バックドア基準」の解説の多くは、統計学の言語で、「バックドア基準」を解説しています。

 

こうなると、混乱の極みになります。

 

パールの因果推論は、「因果推論の科学」、「入門統計的因果推論」、「統計的因果推論」の3冊の訳本で、確認することがよいと思われます。