エビデンスの何が問題か(7)

11)エビデンスレベルの点検

 

この考察は、「エビデンスの階層」を正確に理解することを目的としています。

 

エビデンスの階層」自体は、哲学の伝統であるプラグマティズムになります。

 

エビデンスの階層」が正しいという形而上学はありません。

 

エビデンスの階層」は、使ってみて有益であれば、ガイドラインになるという手続きで、正当化されます。

 

表1 エビデンスの階層

 

階層  内容

 

EBL4 メタアナリシス

EBL3 エビデンスに基づく因果研究  

EBL2 ファクトに基づく観察研究   

EBL1 ファクトにに基づかない意見  

最初に、注意をしておきます。

 

エビデンスの階層」は、仮説の検証、あるいは、仮説の確からしさに関する概念です。

 

エビデンスは、因果モデルの概念です。

 

つまり、因果モデルのメンタルモデルがなければ、エビデンスは理解できません。

 

11-1)因果モデルの手順

 

最初に、因果モデルの手順を整理します。

 

ST1:仮説1=(原因=>結果)の因果ダイアグラムを作成する。

 

ST2:仮説2=(原因=>結果)の因果モデル(エスティマンド)を作成する。

 

ST3:検証=前向き研究で得たデータを使って因果モデルの係数を決定する。

 

ST4:予測=因果構造が維持されている場合、原因に値を代入して、結果を予測する。

 

ST4:予測=因果構造が維持されていない場合、予測を放棄する。



エビデンスの階層が扱っている問題は、ST3とST4です。

 

ST1とST2は、エビデンスの階層に含まれません。

 

ST1とST2の違いは、交絡因子にあります。

 

例をあげます。フックの法則は、ばねの伸びが、引っ張る力に比例する法則です。

 

結果(ばねの伸び,y)<=原因(引っ張る力,x)

 

y=a * x

 

フックの法則は、ST2に相当します。

 

実は、「ばねの伸び」は、「引っ張る力」だけでは、決まりません。

 

「ばねの伸び」は、「ばねの温度」の影響を受けます。

 

結果(ばねの伸び)<=原因1(引っ張る力)+原因2(ばねの温度)

 

この式が、ST1の因果ダイアグラムに相当します。

 

ここでは、測定期間中に、ばねの温度が変わらなければ、交絡因子の「ばねの温度」の影響は無視できます。

 

これが、ST2になります。

 

ST3で、実験をすれば、係数aを求めることができます。

 

y=a * x

 

を使う時には、原因xの値を変えて、yを予測します。

 

ばねが古くなって、金属疲労をおこしている場合には、「因果構造が維持されていない」可能性があります。

 

あるいは、ばねが切れてしまいそうな大きな力をかければ、「因果構造が維持されていなく」なります。

 

そのような場合には、フックの法則は使えません。

 

パール氏は、この判断の根拠は主観であるといいます。

 

将来も、「因果構造が維持される」か否かを予測できる客観法則はありません。

 

しかし、多くの場合には、主観で問題のない判断ができます。

 

物理法則の場合には、交絡因子は簡単な場合が多いです。

 

また、実験室の外をでれば、原因と交絡因子の制御は困難になります。

 

例えば、実験装置を屋外に設定して、ばねの先に、バケツをつけて、バケツに毎日の降水が入るようにすれば、力変化に対応したばねの伸びのデータが毎日1つずつ得られます。しかし、この場合には、温度は一定ではなく、交絡因子の影響が残ります。

 

実験室を出れば、交絡因子の制御は、困難になります。

 

11-2)ファクトに基づく観察研究

 

ファクトに基づく観察研究は、因果ダイグラムと交絡因子を無視しています。

 

この方法は、交絡因子の影響が無視できる場合には、成功する可能性があります。

 

フックの法則「y=a * x」を観察研究で進める場合を考えます。

 

力Xを換えて、yを測定する実験を100回繰り返せば、100組のデータが得られます。

 

この100組のデータをつかって、回帰分析をすれば、係数aを求めることができます。

 

しかし、この方法は間違いです。仮説の検証には、仮説(モデル)の作成と仮説(モデル)の検証のステップが必要です。

 

最近よく使われる方法は、交差検証法です。

 

これは、100組のデータを2グループにわけます。

 

第1グループには、80組のデータが、第2グループには、20組のデータが含まれるようにします。

 

100組のデータを並べます。

 

第2グループを100個のデータの1番目から、1つずつずらしてとれば、100個の第2グループのデータができます。82番目からは、20個のデータがとれなくなりますが、不足分は、折り返して1番目からとることにします。

 

100組のデータから、20個の第2グループのデータを除いた80個を、第1グループに割り当てます。

 

こうすると、80個と20個に分けた100組のデータができます。

 

80個のデータを使って、回帰分析を行い、20個のデータを使って、検証をします。

 

これを繰り返すと、100個の係数aが求まります。

 

この先の処理は、お好みに合わせればよいと思います。

 

ともかく、係数aは、分布を持った変数になります。

 

交差検証法は、データサイエンスの典型的な手法ですが、ファクトに基づく観察研究になっています。

 

交差検証法を使わないモデルは、ノイズに対する応答が分離されていない過学習になります。

 

得られたモデルは、交絡因子を無視した相関モデルであり、因果モデルはありません。

 

11-3)ファクトのまちがい

ファクトに基づく観察研究の典型は、原始的な帰納法です。

 

原始的な帰納法は、交差検証法のように、モデルの作成とモデルの検証が分離されていません。

 

原始的な帰納法は、モデルの検証になっていません。

 

相関と因果の大きな違いは、交絡因子にあります。

 

メンタルモデルで、交絡因子が確認できる場合には、相関モデルは、使い物になりません。

 

インフレになれば経済成長する(インフレ:原因=>経済成長:結果)というモデルは間違いです。

 

メンタモデルで考えれば、(生産性向上:原因=>経済成長:結果)になります。

 

経済成長すればインフレになる(経済成長:原因=>インフレ:結果)というモデルが、まともな因果です。

 

こうした場合の判断は、メンタルモデルで十分です。

 

2つのモデルがあります。

 

M1(経済成長:原因=>インフレ:結果)

 

M2(インフレ:原因=>経済成長:結果)

 

この2つを並べて、M2のほうが、M1より正しいと考える人は少ないと思います。

 

仮に、100歩ゆずって、M2が正しいと考えます。

 

その場合でも、「生産性向上」という交絡因子があります。

 

経済成長:結果<=インフレ:原因1 + 生産性向上:原因2

 

政府は、この簡略版の因果ダイアグラムで、インフレの効果が、生産性向上の効果に優るといっています。生産性向上の効果は無視できるといっています。

 

1971年までの、高度経済成長は、農業から、工業への労働移動によって引き起こされました。

 

インフレによって、高度経済成長が実現した訳ではありません。

 

2000年以降のアメリカ経済の成長は、工業からデジタル産業への労働移動によって、生じています。(注1)

 

日本が経済成長しない原因は、工業からデジタル産業への労働移動が起こっていないからです。

筆者は、現在のビッグデータのデータサイエンスは、ほとんどが、ファクトに基づく観察研究を高速化したものであると考えています。

 

なぜなら、使っているデータは、do属性のない観察研究データだからです。

 

現在のAIでは、反事実の問題を扱えません。

 

観察研究は問題だらけなのですが、人間の心理バイアスにフィットするので、抜けだすことは容易ではありません。

 

次回は、観察研究の問題をさらに、考えます。

 

注1:

 

工業からデジタル産業への労働移動がおこると、工業労働者の賃金が下がります。

 

これは、工業化で、農業者の賃金が相対的に低下したのと同じ現象です。

 

ただし、デジタル産業が要求する労働の能力水準が高いので、格差が生じます。

 

筆者は、経済学は、3つの部分でできていると考えています。

 

第1は、生産性を最大化して、経済成長をする条件を見出す効率性の経済学です。

 

第2は、第1の補足です。第1は、市場均衡モデルを前提にしています。しかし、現実には、市場均衡はなりたたず、均衡解の周辺で、需給バランスが変動します。

 

この変動に関する理論は、未熟です、

 

第3は、平等性の経済学です。第3の経済学の理論は、観察研究では求められないので、大変遅れています。

 

公共経済学は、数少ない使える理論ですが、不備も多いです。

 

公共経済学によれば、リスキリングの補助金よりも、基礎教育(公共財)に、税金を投入すべきです。

 

トランプ氏は、関税で調整を図る計画です。

 

関税強化では問題解決ができないという人がいます。

 

しかし、「工業からデジタル産業への労働移動がおこると、工業労働者の賃金が下がる」問題を解決する手法は見つかっていません。

 

デジタル産業については、自由貿易の原理が機能するのかも不明です。

 

ノースボルトは、破綻してしまいました。

 

「中国は技術的に欧米より10年進んでいる」という人もいます。

 

<< 引用文献

アングル:ノースボルト破綻で遠のく中国勢、狂った欧州の電池戦略 2024/11/25 ロイター Marie Mannes, Alessandro Parodi, Stine Jacobsen

https://jp.reuters.com/markets/bonds/33H3N3LN4ZK5JJGUCNNERA343A-2024-11-25/

>>

 

EUも、関税化に動いています。

 

これは、難民問題に似ています。原理原則(イデオロギー)ではなく、ファクトをみながら、調整しないと立ち行きません。

 

「中国は技術的に欧米より10年進んだ」原因は、政府の補助金なのか、技術者の能力なのかわかりません。しかし、当面は、ドラスティックな変化を押さえないと社会が回りません。

 

現在の温暖化対策は、科学ではなく、政治取引になっています。

 

<< 引用文献

COP29閉幕、年46兆円超の気候対策支援で合意 「あまりに不十分で手遅れ」と途上国は非難 2024/11/25 BBC

https://www.bbc.com/japanese/articles/c748ezg8nj8o

>>

 

温暖化対策が必要かもしれませんが、政治取引というプロセスは、資本主義ではなく、社会主義です。

 

先進国の納税者が、見返りなしに、年46兆円超を払うことに納得するでしょうか。受け入れ側の途上国には、独裁国家や、温暖化対策より、内戦に熱心な国もあります。

 

また、貧困問題や生物多様性問題に優先して、温暖化対策をする合理的な根拠はありません。

 

エビデンスに基づく手法は、因果モデルですが、そのスタートには、既存の通説をエビデンスに基づいて見直すという基本スタンスがあります。「エビデンスの階層」は、そのためのガイドラインになります。

 

ヒューム氏は、過去に成り立った法則が、将来も成り立つと考える根拠はないと言いました。パール氏は、過去に成り立った法則が因果法則である場合、将来も、その因果構造が維持されていると主観で判断できる場合には、将来も因果法則が使えると主張しています。

 

現実には、自由貿易の原則は、正確には、成り立っていません。また、自由貿易の原則を、振り回せば、問題が解決できるというエビデンスはありません。この点では、ルーカス批判は、正しい指摘だったと思われます。