ルーカス批判と「因果推論の科学」 - computer

１１）相関モデルと因果モデルの関係

相関は、因果ではありません。

したがって、相関モデル（観察データに基づくモデル）では、介入効果の推定はできません。

観察モデルは、介入モデル（介入データに基づくモデル）の代用にはなりません。

しかし、日本語の教科書で、このことを明示するようになったのは、2020年以降のようです。

書籍名	著者	出版年	相関と因果の区別	相関モデルの限界の明示	実務的な警告の有無
『効果検証入門』	安井翔太	2021年	回帰分析と因果推論の違いを明確に区別	相関モデルでは介入効果を誤る可能性を強調	明示的に警告あり（例：政策評価での誤用）
『Causal Inference Using R』	山口翼	2023年	因果推論の基本概念を丁寧に導入	相関と因果の混同による誤推定を図解で説明	実務上の注意点を多数提示
『はじめての統計的因果推論』	林岳彦	2024年	初学者向けに相関と因果の違いを平易に解説	相関モデルの限界を具体例で説明	教育・医療分野での誤用リスクを指摘
『データ分析のための因果推論入門』	小林佑太	2022年	データ分析実務と因果推論の接続を重視	回帰分析の限界と因果モデルの必要性を強調	実務者向けに誤用回避の指針あり

「Causal Inference Using R」のネタ本は、次です。

Causal inference in statistics: A primer (邦訳「入門統計的因果推論」)(Pearl et al. 2016)

「Causal Inference Using R」のコードは以下にあります。

Causal Inference Using R

スタンフォード大学の研究者の論文を紹介している記事があります。この例は、相関モデル（観察データに基づくモデル）で、介入効果を推定しています。正確には、原論文は、介入効果に言及していませんが、読んだ人が、相関モデル（観察データに基づくモデル）で、介入効果を推定したのかも知れません。

＜

アメリカを含む38カ国のデータを分析したところ、リモートワークと出産の間に「正の相関関係」が見て取れたという。少子化に悩まされている国は、もしかするとリモートワークを普及させることで「ベビーブーム」を起こせるのかもしれない。

＞

このような例は、2025年現在でも多く見られます。

相関モデル（観察データに基づくモデル）では、介入効果の推定はできないことが教科書で明示されたのが、2020年以降ですから、自分でエラーに気づかない卒業生は、ほぼ全員が、間違いに気づいていません。

経済学のモデルの多くは、観察モデルです。経済政策は、介入になるので、観察モデルを使うことは出来ません。

しかし、新聞とWEBでみる経済の専門家の大半は、観察モデルで、経済政策を説明しています。

上記の教科書で、経済学を正面から扱ったものはないように思われます。

さて、相関モデルは、因果モデルの代用にはなりませんが、この２つのモデルの間には、関連性があります。

少なくとも、ノードの共有がなされる場合が多くあります。

ノードは要素（変数）に対応しているので、ノードにリストアップされてない

要素（変数）を考えることが難しいことが、その理由と思われます。

これは、相関関係があれば、因果関係がある場合があると表現されます。

しかし、相関関係があっても、因果関係がない場合もあります。

また、相関関係がなくとも、因果関係がある場合もあります。

ただし、最後の表現は、次のようにより正確に書く必要があります。

観察された変数の間に相関関係がなくとも、因果関係がある場合もあります。

観察されなかった変数の間に相関関係がなくとも、因果関係がある場合もあります。

この最後の「観察されなかった変数」という表現には、難しさがあります。

パールは、「データ表現ー＞データ取得ー＞データに基づく推論」というデータ表現先行パラダイムが成り立つといいます。

「観察されなかった」を「データ表現がない」と考えると、「観察されなかった変数」に関する推論ができないことになります。

相関モデルの典型は、ベイジアンネットワークです。

ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。

「観察されなかった変数」に関する推論ができる場合は、ないものを探すという推論になります。「ないもの」は、ノードになっていないので、ベイジアンネットワークの中から抽出することはできません。

とはいえ、ベイジアンネットワークを丁寧につくれば、ほぼ、見落としはないと思われます。

ベイジアンネットワークのノードにリストアップされてない要素（変数）を考えることが必要がないと思われます。

ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。

この場合に、問題になる点は、「ベイジアンネットワークの一部のノードを切り出すときに、相関係数を参考にできるか」という問題です。

これに対する理論的な解答は、例外を除いて「参考にできない」です。

例外は、重回帰分析が、交絡因子の調整になっている場合などです。