11)相関モデルと因果モデルの関係
相関は、因果ではありません。
したがって、相関モデル(観察データに基づくモデル)では、介入効果の推定はできません。
観察モデルは、介入モデル(介入データに基づくモデル)の代用にはなりません。
しかし、日本語の教科書で、このことを明示するようになったのは、2020年以降のようです。
|
書籍名 |
著者 |
出版年 |
相関と因果の区別 |
相関モデルの限界の明示 |
実務的な警告の有無 |
|---|---|---|---|---|---|
|
『効果検証入門』 |
安井翔太 |
2021年 |
回帰分析と因果推論の違いを明確に区別 |
相関モデルでは介入効果を誤る可能性を強調 |
明示的に警告あり(例:政策評価での誤用) |
|
『Causal Inference Using R』 |
山口翼 |
2023年 |
因果推論の基本概念を丁寧に導入 |
相関と因果の混同による誤推定を図解で説明 |
実務上の注意点を多数提示 |
|
『はじめての統計的因果推論』 |
林岳彦 |
2024年 |
初学者向けに相関と因果の違いを平易に解説 |
相関モデルの限界を具体例で説明 |
教育・医療分野での誤用リスクを指摘 |
|
『データ分析のための因果推論入門』 |
小林佑太 |
2022年 |
データ分析実務と因果推論の接続を重視 |
回帰分析の限界と因果モデルの必要性を強調 |
実務者向けに誤用回避の指針あり |
「Causal Inference Using R」のネタ本は、次です。
Causal inference in statistics: A primer (邦訳「入門統計的因果推論」)(Pearl et al. 2016)
「Causal Inference Using R」のコードは以下にあります。
Causal Inference Using R
https://tsubasayamaguchi-jinrui.github.io/Causal_Inference_bookdown/index.html
スタンフォード大学の研究者の論文を紹介している記事があります。この例は、相関モデル(観察データに基づくモデル)で、介入効果を推定しています。正確には、原論文は、介入効果に言及していませんが、読んだ人が、相関モデル(観察データに基づくモデル)で、介入効果を推定したのかも知れません。
<
アメリカを含む38カ国のデータを分析したところ、リモートワークと出産の間に「正の相関関係」が見て取れたという。少子化に悩まされている国は、もしかするとリモートワークを普及させることで「ベビーブーム」を起こせるのかもしれない。
>
このような例は、2025年現在でも多く見られます。
相関モデル(観察データに基づくモデル)では、介入効果の推定はできないことが教科書で明示されたのが、2020年以降ですから、自分でエラーに気づかない卒業生は、ほぼ全員が、間違いに気づいていません。
経済学のモデルの多くは、観察モデルです。経済政策は、介入になるので、観察モデルを使うことは出来ません。
しかし、新聞とWEBでみる経済の専門家の大半は、観察モデルで、経済政策を説明しています。
上記の教科書で、経済学を正面から扱ったものはないように思われます。
さて、相関モデルは、因果モデルの代用にはなりませんが、この2つのモデルの間には、関連性があります。
少なくとも、ノードの共有がなされる場合が多くあります。
ノードは要素(変数)に対応しているので、ノードにリストアップされてない
要素(変数)を考えることが難しいことが、その理由と思われます。
これは、相関関係があれば、因果関係がある場合があると表現されます。
しかし、相関関係があっても、因果関係がない場合もあります。
また、相関関係がなくとも、因果関係がある場合もあります。
ただし、最後の表現は、次のようにより正確に書く必要があります。
観察された変数の間に相関関係がなくとも、因果関係がある場合もあります。
観察されなかった変数の間に相関関係がなくとも、因果関係がある場合もあります。
この最後の「観察されなかった変数」という表現には、難しさがあります。
パールは、「データ表現ー>データ取得ー>データに基づく推論」というデータ表現先行パラダイムが成り立つといいます。
「観察されなかった」を「データ表現がない」と考えると、「観察されなかった変数」に関する推論ができないことになります。
相関モデルの典型は、ベイジアンネットワークです。
ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。
「観察されなかった変数」に関する推論ができる場合は、ないものを探すという推論になります。「ないもの」は、ノードになっていないので、ベイジアンネットワークの中から抽出することはできません。
とはいえ、ベイジアンネットワークを丁寧につくれば、ほぼ、見落としはないと思われます。
ベイジアンネットワークのノードにリストアップされてない要素(変数)を考えることが必要がないと思われます。
ベイジアンネットワークの一部のノードを切り出して、ネットワークに矢印をつけると因果ダイアグラムが出来あがります。
この場合に、問題になる点は、「ベイジアンネットワークの一部のノードを切り出すときに、相関係数を参考にできるか」という問題です。
これに対する理論的な解答は、例外を除いて「参考にできない」です。
例外は、重回帰分析が、交絡因子の調整になっている場合などです。