ルーカス批判と「因果推論の科学」

11)相関モデルと因果モデルの関係

 

相関は、因果ではありません。

 

したがって、相関モデル(観察データに基づくモデル)では、介入効果の推定はできません。

 

観察モデルは、介入モデル(介入データに基づくモデル)の代用にはなりません。

 

しかし、日本語の教科書で、このことを明示するようになったのは、2020年以降のようです。



書籍名

著者

出版年

相関と因果の区別

相関モデルの限界の明示

実務的な警告の有無

『効果検証入門』

安井翔太

2021年

回帰分析と因果推論の違いを明確に区別

相関モデルでは介入効果を誤る可能性を強調

明示的に警告あり(例:政策評価での誤用)

『Causal Inference Using R』

山口翼

2023年

因果推論の基本概念を丁寧に導入

相関と因果の混同による誤推定を図解で説明

実務上の注意点を多数提示

『はじめての統計的因果推論』

林岳彦

2024年

初学者向けに相関と因果の違いを平易に解説

相関モデルの限界を具体例で説明

教育・医療分野での誤用リスクを指摘

『データ分析のための因果推論入門』

小林佑太

2022年

データ分析実務と因果推論の接続を重視

回帰分析の限界と因果モデルの必要性を強調

実務者向けに誤用回避の指針あり

「Causal Inference Using R」のネタ本は、次です。

 

Causal inference in statistics: A primer (邦訳「入門統計的因果推論」)(Pearl et al. 2016)

 

「Causal Inference Using R」のコードは以下にあります。

 

Causal Inference Using R

https://tsubasayamaguchi-jinrui.github.io/Causal_Inference_bookdown/index.html

 

スタンフォード大学の研究者の論文を紹介している記事があります。この例は、相関モデル(観察データに基づくモデル)で、介入効果を推定しています。正確には、原論文は、介入効果に言及していませんが、読んだ人が、相関モデル(観察データに基づくモデル)で、介入効果を推定したのかも知れません。

アメリカを含む38カ国のデータを分析したところ、リモートワークと出産の間に「正の相関関係」が見て取れたという。少子化に悩まされている国は、もしかするとリモートワークを普及させることで「ベビーブーム」を起こせるのかもしれない。

 

このような例は、2025年現在でも多く見られます。

 

相関モデル(観察データに基づくモデル)では、介入効果の推定はできないことが教科書で明示されたのが、2020年以降ですから、自分でエラーに気づかない卒業生は、ほぼ全員が、間違いに気づいていません。

 

経済学のモデルの多くは、観察モデルです。経済政策は、介入になるので、観察モデルを使うことは出来ません。

 

しかし、新聞とWEBでみる経済の専門家の大半は、観察モデルで、経済政策を説明しています。

 

上記の教科書で、経済学を正面から扱ったものはないように思われます。

 

さて、相関モデルは、因果モデルの代用にはなりませんが、この2つのモデルの間には、関連性があります。

 

少なくとも、ノードの共有がなされる場合が多くあります。

 

ノードは要素(変数)に対応しているので、ノードにリストアップされてない

要素(変数)を考えることが難しいことが、その理由と思われます。

 

これは、相関関係があれば、因果関係がある場合があると表現されます。

 

しかし、相関関係があっても、因果関係がない場合もあります。

 

また、相関関係がなくとも、因果関係がある場合もあります。

 

ただし、最後の表現は、次のようにより正確に書く必要があります。

 

観察された変数の間に相関関係がなくとも、因果関係がある場合もあります。

 

観察されなかった変数の間に相関関係がなくとも、因果関係がある場合もあります。

 

この最後の「観察されなかった変数」という表現には、難しさがあります。

 

パールは、「データ表現ー>データ取得ー>データに基づく推論」というデータ表現先行パラダイムが成り立つといいます。

 

「観察されなかった」を「データ表現がない」と考えると、「観察されなかった変数」に関する推論ができないことになります。

 

相関モデルの典型は、ベイジアンネットワークです。

 

ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。

「観察されなかった変数」に関する推論ができる場合は、ないものを探すという推論になります。「ないもの」は、ノードになっていないので、ベイジアンネットワークの中から抽出することはできません。

 

とはいえ、ベイジアンネットワークを丁寧につくれば、ほぼ、見落としはないと思われます。

 

ベイジアンネットワークのノードにリストアップされてない要素(変数)を考えることが必要がないと思われます。

 

ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。

 

この場合に、問題になる点は、「ベイジアンネットワークの一部のノードを切り出すときに、相関係数を参考にできるか」という問題です。

 

これに対する理論的な解答は、例外を除いて「参考にできない」です。

 

例外は、重回帰分析が、交絡因子の調整になっている場合などです。