注:これは、ジューディア・パール、ダナ・マッケンジー「因果推論の科学―「なぜ?」の問いにどう答えるか」のコメントです。
(26)反事実2.0
1)定義
1-1)反事実の定義
反事実とは、ヒュームがみつけた概念です。
因果推論では、原因がある場合と原因がない場合を考えますが、事実として実現する現象が1つだけなので、実現しなかった(反事実)が出来ます。この2つをセットで考えることが反事実です。
発想のスタートは、複数の原因の比較にありますが、複数の原因に対応して、複数の結果が生まれますので、実現しなかった結果、あるいは、原因と結果の組合せを反事実と呼びます。
サイコロを振るような確率現象の場合には、1つの原因に対して、複数の結果が生じます。
この場合には、原因は、事実だけですが、結果に反事実が含まれることになります。
1-2)反事実2.0の定義
因果推論では、原因から、結果が生じると考えます。
原因=>結果
ヒュームは、原因と結果の間には、タイムラグがあると考えました。
この条件は、因果モデルに必須ではありませんが、多くの因果モデルにあてはまる条件です。
単純化した離散時間を考えると、次になります。
原因(t=s)=>結果(t=s+1)
s+1を現在時間とすれば、この式は、因果モデルの作成を意味します。
sを現在時間とすれば、この式は、将来の予測になります。
sを現在時間にとる場合には、次のように表記を省略可能です。
原因=>結果(+1)
sを現在時間にとる場合には、結果(+1)はまだ実現していませんので、予測値になります。予測値(E)であることを強調すれば、次になります。
原因=>結果E(+1)
原因は、観測値なので、観測誤差を除けば、確定値になりますが、原因を処理をすることができます。例えば、次のように書けます。
原因1=>結果1E(+1)
原因2=>結果2E(+1)
原因3=>結果3E(+1)
これは、反事実の記載に対応しています。
さて、因果推論とは、論理的なむすびつきがありませんが、多くの場合、結果が観測されています。
因果モデルを使わない場合、次のようにトレンド予測(>>)が行なわれます。
結果 >> 結果E(+1)
数式で書けば、次になります。
Δ結果=結果ー結果(ー1)
結果E(+1)=結果+Δ結果
より、簡略化して、「Δ結果=0」とする場合もありますが、ここでは、簡略する場合と簡略化しない場合をまとめてトレンド予測とよびます。
トレンド予測で得られた結果と「結果E(+1|trend)」、因果推論で得られた予測「結果E(+1|do)」が多くの場合課題になります。
この2つの予測を比較することを反事実2.0と呼ぶことにします。
反事実2.0は、反事実の派生形ですが、問題になる頻度が非常に高いこと、「結果E(+1|trend)」を明示することで、問題点が整理ができるので、名前を付けています。
2)実例
2-1)犬の因果モデル
「犬の因果モデル」とは、「遠くから近づいてくる物体がある場合(原因)、テリトリーに物体が侵入する可能性が高い(結果)」という因果モデルでした。
現在のテリトリーの状態(他の犬がいない)をトレンド予測すれば、次になります。
結界E(+1)=結果E(+1|trend)=結果=(テリトリーに他の犬がいない)
犬の因果モデルの推論の結果は以下になります。
結果E(+1)=結果E(+1|do)=(テリトリーに他の犬がいる)
ここでは、(テリトリーに他の犬がいない)と(テリトリーに他の犬がいる)が反事実2.0になります。
犬は、現在、テリトリーに他の犬がいない状態を観測しています。
犬は、因果推論して、テリトリーに他の犬がいない状態は継続しない(トレンド予測が成り立たない)と考えています。
2-2)学歴と進学熱
難関大学に入学すれば、高い生涯賃金を得られると考えている人がいます。
あるいは、医師になれば、高い生涯賃金を得られると考えている人がいます。
卒業大学ごとに、年収の統計を比較している記事もあります。
これらの記事のデータ処理には、問題が多く、適切な代表値を抽出できていない場合も多いです。
以下では、とりあえず、統計処理のエラーは訂正されているという前提で議論を進めます。
アメリカの大学では、学科毎の給与の統計データが入手でき、生涯賃金の高い学科の競争率は高くなっています。
日本の大学では、このようなデータは公開されていません。年功型賃金では、初任給は一律です。女性の昇進は遅れています。そもそも、給与はポストに連動していて、能力を評価できる人はほとんどいません。実績主義は能力主義ではありません。アウトカムは、ポストに左右されます。実績主義では、女性の昇進は遅れます。
野口悠紀雄氏は、半導体産業を例に、企業活動と技術の関係を論じています。(筆者要約)
<
日本の企業活動は、大学がなくても継続できる。日本では、新しい技術は、大学ではなく、企業が実務を通じてOJTで教えている。これは日本の伝統で、これからも変わりそうにない。
日本の企業活動は、初等・中等教育までの知識で成り立っているが、アメリカの企業活動は、大学院教育に基づいて成り立っている。
>
<< 引用文献
エヌビディアの時価総額が一時「世界首位」のウラで…日本の半導体産業が「アメリカには絶対追いつけない」哀しい理由 2024/07/14 現代ビジネス 野口悠紀雄
https://gendai.media/articles/-/133177?imp=0
>>
つまり、アメリカの大学院と企業の間には、次の因果関係(高度人材モデル)があります。
大学院
高度な技術教育(原因)=>高度人材の育成(結果)
企業
高度人材の採用(結果)=>高度な技術開発(結果)
高度な技術開発(原因)=>高い収益(結果)
高い収益(原因)=>高い給与の提示(結果)
高い給与の提示(原因)=>高度人材の採用(結果)
日本の大学教育と企業の技術開発の間には、因果関係がありません。
企業が実務を通じてOJTで新しい技術を教えることはできますが、高度な技術を習得することはできません。
高度な技術の実体は、数学とコンピュータサイエンスだからです。
高度な技術開発は、高度人材にしかできません。
高度な人材が一斉にやめてしまわない限り、高度な人材を抱えている企業は競争優位です。
つまり、業績のよい企業を中心に組んだインデックス投資には、因果モデルがあてはまります。
日本の企業の業績は、高度人材に支えられていません。人材依存ではありません。企業の経営が人材依存でない場合には、収益が見劣りし、ボラリティが高くなります。これは、実態を説明できています。
さて、問題は混乱を認めることです。
市場原理が生きている場合には、経済効率を優先しますので、高度人材モデルが成立します。
日本には、解雇規制があり、労働市場がありません。つまり、スキルを身につけた高度人前であれば、高い給与が得られる訳ではありません。
日本の経済は、市場経済ではなく、中抜き経済になっています。
所得は、中抜き構造で決まります。
日本経済のデータをあつめて分析すれば、高度なスキルがあれば、高い所得が得られるという結果は得られません。
これは、中抜き経済が、日本の経済データを作成するデータジェネレータになっていると考えれば納得できます。
経済データは、データジェネレータが原因になって作られる結果です。
データジェネレータが変われば、結果は変わります。
中抜き経済のデータジェネレータは利権の構造の影響を大きく受けています。
利権の構造が維持できている範囲では、因果推論は無効で、トレンド予測があたります。
例えば、年功型雇用は、利権の構造です。年功型賃金体系のデータを分析すれば、因果推論は無効で、トレンド予測が有効になります。
年功型雇用の中で生活すると「因果推論は無効で、トレンド予測が有効」であるという認知バイアスが形成されます。
「トレンド予測が有効」になる因果構造は、中抜き経済が原因で出来あがっています。
原因である中抜き経済が崩壊すれば、「トレンド予測が無効」になります。
例えば、医師の所得は中抜き経済によって担保されています。
中抜き経済は破綻しかかっています。
破綻した結果、看護師や医薬品の価格の抑制が行なわれています。
次のステップでは、医師の所得がターゲットになります。
因果モデルで考えれば、高い給与(結果)には、高い生産性(原因)が必要です。
医療費の総額が増えないのであれば、生産性をあげて、医師の数を減らせば、高い給与が維持できます。
トレンド予測で得られた結果「結果E(+1|trend)」と、因果推論で得られた予測「結果E(+1|do)」を比較します。
結果E(+1|trend)は、医師の数が変わらない場合です。
結果E(+1|do)は、医師の数が減った場合です。
医師の数を減らすには、医師の行った仕事を、看護師などの他の人に移すか、AIなどの機械に移すことになります。
看護師も人手不足なので、医師の行った仕事を、看護師に移せる余裕は少ないです。
選択肢としては、たとえば、AIによるリモート診療で、症状の軽い患者を処理して、スクリーニングして、重症化リスクの高い患者を人間の医師が担当する方法が考えられます。
労働市場がある場合には、「結果E(+1|do)=医師の数が減った場合」を受け入れることができます。
中抜き経済がある場合には、「結果E(+1|do)=医師の数が減った場合」を受け入れることは困難です。
「結果E(+1|do)=医師の数が減った場合」を受け入れる場合には、AIによるリモート診療は、望ましい問題の解決手段になります。
「結果E(+1|trend)=医師の数が変わらない場合」を受け入れる場合には、AIによるリモート診療は、利権構造の破壊者になります。
「医師の数が変わらない場合」が事実であれば、「医師の数が減った場合」は反事実になります。
犬の因果モデルでは、犬は遠くから近寄ってくる他の犬を見つけたときに、「結果E(+1|trend)=テリトリーに他の犬がいない」は、実現せず、「結果E(+1|do)=テリトリーに他の犬がいる」になるという因果推論を優先しています。
「社会保障と医療保険制度の破綻」は、「遠くから近寄ってくる他の犬」に相当します。
つまり、反事実を受け入れるためには、「遠くから近寄ってくる他の犬」に相当する「社会保障と医療保険制度の破綻」を受け入れる必要があります。
開業医の給与体系は、個人事業主です。年功型雇用の利権に基づく中抜き経済はありません。
官庁、大企業、大学のように年功型雇用の利権に基づく中抜き経済の世界では、因果推論ができず、反事実2.0がうけいれられません。
2-3)iPhone
世界で最初のスマホのマーケット予測をする場合、スマホは存在しないので、トレンド予測で得られた結果「結果E(+1|trend)」はありません。
つまり、因果推論が唯一の方法になります。
DXも同じで、トレンド予測で得られた結果は、DXが進んでいない(スマホが導入されていない)状態をしめしいます。
DXが進んだ場合(スマホが導入された場合)の予測は、因果推論でしかできません。
ガラケーの時代に、DXの調査をすれば、DXには、スマホは含まれません。
スマホの時代に、DXの調査をすれば、DXには、スマホが含まれます。
DXという変数名には、識別子としての意味しかありません。
問題は、スマホが含まれるか否かというインスタンスの違いです。
スマホが含まれないDXでは、インターネットも、クラウドも含まれません。
ガラケーを使っている人にDXのアンケートをしても、そのアンケートには、インターネットも、クラウドも反映されていません。
新技術の効果は、トレンド予測で判断できません。
スマホにマーケットがあるか、スマホのDXの効果は、因果推論でのみ可能です。
政府は、DXのトレンド予測を繰り返しています。
<< 引用文献
「デジタルトランスフォーメーション調査 (DX調査)2024」 について 2023 経済産業省
https://www.meti.go.jp/policy/it_policy/investment/keiei_meigara/dxchosa2024info.pdf
我が国におけるデジタル化の取組状況 令和3年 情報通信白書
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r03/html/nd112420.html
https://www.digital.go.jp/resources/govdashboard/local-government-dx
>>
これらの調査結果は、無意味で、経費と時間の浪費です。
官僚は、先例主義で、前例と同じ間違いをしても、責任は問われないと考えます。
しかし、これは、倫理判断の放棄であり間違いです。
官僚は、因果推論ができません。
トレンド予測を越えた、反事実2.0をクリアできないのです。
自動車の型式認証にも、反事実2.0をクリアできない問題があります。
型式認証の目的は、安全性の向上です。
型式認証が技術進歩を阻害しています。安全性を低下させています。
型式認証という変数名とインスタンスは別の概念です。
携帯電話という変数名は、個別の移動電話のインスタンスから構成されます。
ガラケーの時代には、携帯電話のインスタンスは、ガラケーと衛星電話でした。
インスタンスは、その時代によって変わります。変数名とインスタンスを完全に対応させるためには、変数名(集合)に含まれる全ての要素を羅列して、集合を定義する必要があります。たとえば、日本人という集合は、この方式をとって定義されます。
しかし、この方法では、日本人の集合は、毎日変化することになります。
自動車の型式認証は、サンプリング検査ですので、全数ルールは使えません。
型式認証のルールは、集合論と確率の数学に従っている必要があります。
数学ができない官僚が権威を振り回せば、経済が破壊されます。
3)ファスト・アンド・スロー
カーネマンは、「ファスト・アンド・スロー」の中で、トレンド予測をファスト回路、因果推論をスロー回路と呼んでいます。
カーネマンは、ファスト回路の利用率が高いといいます。
これは、スロー回路の推論には、時間とエネルギーがかかるためです。
反事実2.0をあえて取り上げる理由は、トレンド予測のファスト回路の使用頻度が高い点にあります。
ところで、因果推論の科学が進んでいけば、因果推論の主な部分は、AIが代行することができるようになります。
現状では、、トレンド予測のファスト回路が90%、因果推論のスロー回路が10%くらいの推論のシェアであると思われます。
強いAIが実現すれば、トレンド予測のファスト回路が10%、因果推論のスロー回路が90%くらいの推論のシェアも考えられます。
その世界では、推論が現在とはまったく異なった意味を持っていると思われます。
そして、その前に、トレンド予測のファスト回路と因果推論のスロー回路の境界は何できまっているのかという疑問があります。