「因果推論の科学」をめぐって(25)

注:これは、ジューディア・パール、ダナ・マッケンジー「因果推論の科学―「なぜ?」の問いにどう答えるか」のコメントです。

 

(25)知力のモデル



パール先生は、ミニ・チューリングテストで因果推論の知力をテストする目的を設定しています。

 

現時点でわかっている知力には、次の3種類があります。

 

1)メモリー・モデル

 

第1は、メモリー(記憶)です。

 

百科全書の時代から、事例データベースが、知識の根源であると考える人がいました。

 

遡れば、図書館の発明は、「知力=メモリー」の知力モデルの起源です。

 

モリーモデルの知力では、記憶プロセスと想起プロセスが必要になります。

 

図書館では、分類インデックスをつけることで、想起プロセスを実現していました。

 

しかし、書物の中のキーワードの検索はできませんでした。

 

Google検索は、全文データベースにのっていれば、キーワード検索ができます。

 

想起プロセスのないメモリーは、社会に対しては、存在しないのと同じ効果しかありません。

 

「記憶プロセスと想起プロセス」は、論説単位でみれば、論説の書き手と論文の読み手になります。

 

読者のいない論説は、社会に対しては、存在しないのと同じ効果しかありません。



読み手の利便性を考えれば、ウィペディアやPlos-ONEのように、読者に直接対価を求めないビジネスモデルが、もっとも社会的影響力の強いメモリーになります。

 

読者に対価を求めるモデルの場合でも、内容の一部を公開する手法がとられています。

 

たとえば、新刊書を発売した場合に、WEBに内容の要約を掲載する手法です。

 

公開されている情報の量は、社会に影響します。

 

英語の場合には、無料の教科書が普及しています。

 

筆者は、教育が公共財であると同じように、基礎的な教科書は公共財であると考えます。

 

つまり、無料の教科書のない社会は、公共財の少ない貧しい社会になります。

 

教科書の内容の90%以上は引用なのでs、教科書には、オリジナルな著作権があるのではなく、編集に伴う著作権が主体です。

 

こうしたサマリーをつくる処理は、生成AIもかなりの精度でこなします、

 

画像データについては、従来、想起プロセスの設定が困難でした。

 

しかし、画像認識システムの実現に伴って、想起プロセスが実用化しています。

 

FaceBookは、知り合いをマッチングするシステムを持っています。

 

これは、FaceBookが独自の想起プロセスをもっていて、それが、ビジネスモデルの根幹をなしていることを示しています。

 

TikTokは、類似の動画を探してきます。

 

これは、TikTokが独自の動画の想起プロセスをもっていて、それが、ビジネスモデルの根幹をなしていることを示しています。

 

独自の効率的な想起プロセスを構築する天才がいれば、ビジネスを始められます。

 

これらのアルゴリズムが、公開されることはないと思われます。

 

まとめれば、図書館に起源をもつ「メモリー」型の知力についても、想起プロセスの革命が起こっています。

 

最近では、婚活マッチングアプリが話題になっています。

国は、2021年度から、自治体が行う「AI(人工知能)を活用した婚活支援事業」に補助金交付をしています。年齢や年収といった希望条件に合わなくても、相性の良い見合い相手をAIで選び出すことで、婚姻数を増やし、少子化を食い止めようという狙いです。

 

東京都は、独自のマッチングアプリを2024年度に提供開始する計画です。



こども家庭庁は2024年7月19日に検討会を立ち上げ、若者や専門家の意見を聞いたうえで、2025年度の概算要求に盛り込む計画です。

 

しかし、この政策は、確実に失敗します。「年齢や年収といった希望条件に合わなくても、相性の良い見合い相手をAIで選び出すこと」ができる想起プロセスを持っている企業であれば、FaceBookTikTok以上の成功をおさめているはずです。

 

AIに丸投げしても、問題は解決できません。

 

恐らく、考えられる唯一の例外は、FaceBookTikTokが持っていない個人の遺伝子情報をつかうアルゴリズムです。しかし、このデータには、民間の企業はアクセスできません。

 

若年層の所得をあげるジョブ型雇用の採用を放棄しても、問題解決はできません。

 

こども家庭庁の専門家は、「所得の減少=>婚姻率の減少=>出生数減少」という因果モデルが理解できない(数学ができない)のです。

 

婚活マッチングアプリの効果を感度分析すれば、ほぼゼロになるはずです。

 

数学ができない専門家の推論には権威がありますが、科学的には間違った推論です。

 

権威の方法による意思決定(ブリーフの固定化)よりも、科学的な方法による意思決定(ブリーフの固定化)を優先することは、プラグマティズムです。

 

つまり、アメリカでは、数学ができない専門家の間違った推論が採択されることはありません。

 

日本のブリーフの固定化は、権威の方法に過度に依存して、問題解決を放棄しているという事実を認識すべきです。

 

2)パターンマッチング・モデル

 

画像認識システムでは、パターンマッチングのノウハウは、ニューラルネットワークの構造に保持されます。

 

ノイマン型のコンピュータでは、データとプログラムが分離されて、メモリーに保存されます。

 

古いAIは、プログラムをすべて人間がつくっていましたが、この方法は行き詰りました。

 

そのときのプログラムの中心は、「IF A THEN B」で書かれる推論ルールを1つずつプログラムに組み込む方法でした。

 

この方法を採用した結果、パール先生は、「人工知能の研究は、その分野自体が袋小路に入って」(p.172)しまったといいます。

 

袋小路から抜け出すためには、確率を組み込む必要があることがわかります。

 

パール先生は、「確率の表現に、(中略)互いに緩く結びついた変数のネットワーク(ベイジアンネットワーク、筆者注)をつかうという方法」(p.174)を1985年に命名して、開発しました。



ベイジアンネットワークと機械学習アルゴリズムの関係を整理します。

 

ベイジアンネットワークについて、IBMの小林竜己氏は次のように説明しています。

 

近年の機械学習アルゴリズムは、分類や回帰の予測性能を高度に追い求めてきた結果、モデル化対象をよりよく理解し、理解した結果を人に伝えることを犠牲にした面があります。サポートベクターマシンニューラルネットワークディープラーニング、さらにはアンサンブル学習(複数作成するモデルの予測結果を総合して判断する)といった手法自体も、予測の精度を求める方向での発展でした。私はこれ自体を否定しません。

 

近年の「説明可能AI」研究の高まり、予測精度の追求で置き去りにされた「モデルの解釈・説明性」への再検討が始まりました。分析対象の変数の因果関係をモデル化しようと試みるベイジアンネットワークの方向性は、人に伝えることを前提にした「モデルの解釈・説明性」の一つのアプローチを示しています。

 

ベイジアンネットワークは、モデル精度の点で他の機械学習アルゴリズムに負けてしまうことが多く、主役の場に躍り出ることはほぼありませんが、物事を深く考える学者タイプ(名探偵!)のノードとして、使い方によってはとても価値のある働きをするノードであると言えます。

<< 引用文献

【リレー連載】わたしの推しノード –隠れた関係を見つける名探偵「ベイズノード」が変数間の因果構造を解き明かす 2020/10/19 IBM 小林竜己

https://www.ibm.com/blogs/solutions/jp-ja/spssmodeler-push-node-18/

>>

 

パール先生は、小林氏がいうように、ベイジアンネットワークで、「分析対象の変数の因果関係をモデル化しようと試み」たが、因果モデルにはならなかったといいます。

 

小林氏は、「ベイジアンネットワークは、モデル精度の点で他の機械学習アルゴリズムに負けてしまうことが多く、主役の場に躍り出ることはほぼありません」といいます。

 

これは因果推論よりも、予測精度を優先するという考え方です。

 

筆者は、ビッグデータについては、この判断は適切であると考えます。一方、ルービンのモデルを使うようなデータが少ない場合には、機械学習アルゴリズムが使えないので、この判断はあてはまりません。

 

データが極端に少ない場合の推論は、メンタルモデルに基づく因果モデルに大きく依存します。

 

小林氏が説明するように、機械学習アルゴリズムは、分類や回帰などのパターンマッチングを行ないます。

 

生成AIも基本は、パターンマッチングです。

 

生成AIは、弁護士試験などの難しい試験をクリアできることがわかっています。

 

囲碁の場合、手数が減って詰碁の状態になれば、因果モデルで、手が決まります。

 

その前の段階では、機械学習(パターンマッチング)が有効です。

 

つまり、知力のモデルには、メモリーモデル、パターンマッチングモデル、因果推論モデルがありますが、パターンマッチングモデルで、クリアできる課題が思ったより多かったことがわかりました。

 

生成AIが、予測精度で人間を上回る理論的な根拠はありませんが、技術が普及段階になれば、必要なコストは人間以下になります。

プレクサスのシニアアナリスト、アンドレアス・ボーゲル氏は「今日、AIと機械学習はすでに伝統的なファンドマネジャーと競争できる」と言う。つまり、コンピューターが同じような結果を出してくれるのであれば、高い報酬を払ってポートフォリオマネジャーを雇う必要はないということだ。

<< 引用文献

ヘッジファンドが学んだAIの限界-市場圧倒する運用成績は残せない 2023/10/04 Bloomberg Justina Lee

https://www.bloomberg.co.jp/news/articles/2023-10-04/S1XPVJT0G1KW01

>>

 

適切な技術投資の時期と金額を選ぶことは難しい課題です。

 

日本企業は、太陽光発電に、かなりの技術投資をしましたが、2024年現在では、中国企業にまけて、その投資分のリターンはゼロになっています。

 

生成AIのパターンマッチングが、人間と同じ精度で、速度とメモリー空間の大きさが人間を越えていることは事実です。速度とメモリー空間の大きさは、半導体の価格に大きく依存します。1990年代のスパコンの計算能力は、現在のスマホ以下です。

 

生成AIのパターンマッチングの精度が、人間の精度をはるかに、しのぐ場合、株式運用で、生成AIの巨額の投資を短期間に回収することが可能です。しかし、予測精度が同等の場合には、生成AIへの巨額の投資は、フライングであって、回収ができないことになります。

 

投資対象を限定すれば、生成AIのパターンマッチングが、人間の精度を超える可能性はあります。しかし、分野が限定されれば、巨額の投資の回収は困難です。

 

人間の知力の大きな部分をパターンマッチングが占めていることがわかったことは大きな発見です。

 

カーネマンの「ファスト・アンド・スロー」の世界観のメガネでみれば、「ファスト回路=パターンマッチング」で「スロー回路=因果推論」になります。

 

スロー回路のAIには、劇的な効果が期待できますが、ファスト回路のAIには、人間を超える大きな効果が期待できないのは、自然に思われます。

 

生成AIは、人間以上のメモリー空間と処理速度を持っていますので、このメリットが活かせる分野では、有効な技術です。

 

今後、マーケットの区分毎に、生成AIの種類が分かれてくると思われます。

 

<< 引用文献

コラム:AIブームに陰りか、膨大な投資が実を結ばない恐れも 2024/07/19 ロイターJamie McGeever

https://jp.reuters.com/markets/japan/funds/S23KKF5PFVMG3MELWSJ5VSYG4Y-2024-07-18/

>>



3)因果推論モデル

 

因果推論モデルは、科学の方法です。

 

原因と結果の間には。関係(科学の法則)があると考えます。

 

パール先生は次のように言います。

 

「あることが原因で別のこと(結果、筆者注)が起きる」、「前者(原因、筆者注)を操作すれば後者(結果、筆者注)に変化が起こる」(p.12)

 

これが因果モデルです。

 

原因と結果のインスタンスは、観測できますが、関係は観測できません。

 

科学の法則(因果法則)は、メソッドであり、インスタンスと切り離して存在しません。

 

パール先生は、<因果モデルには、「見ること、行動すること、想像すること」の3つの異なるレベルの認知能力が必要である>(p.50)といいます。

3-1)犬の因果モデル

 

筆者は、犬を飼っていて、毎日散歩につれてきます。

 

我が家の犬は、他の犬に関心があります。

 

遠くから、他の犬が近づいてきます。

 

我が家の犬は、他の犬が、テリトリーに入って来ることを予測して、身構えます。

 

他の犬がテリトリーに侵入すると吠えます。

 

明らかに、我が家の犬は、遠くから近づいてくる犬がいる(原因)と、テリトリーに犬が侵入する(結果)と予測しています。

 

若干の人間の言葉が理解できる犬は、若干の因果推論もできるのでしょう。

 

人間のドライバーの場合、交差点で、人や自動車に衝突しないように、犬と同じような因果推論をしています。

 

人や自動車の動きは、ニュートン運動方程式で記述して解くことができます。

 

しかし、犬も、ドライバーも、ニュートン運動方程式を解いている訳ではありません。

 

使っている因果モデルは、「遠くから近づいてくる犬がいること(原因)から、テリトリーに犬が侵入する(結果)こと」を予測するレベルになります。

 

これを一般化して、「遠くから近づいてくる物体がある場合(原因)、テリトリーに物体が侵入する可能性が高い(結果)」という因果モデルを「犬の因果モデル」と呼ぶことにします。

 

このレベルの因果モデルは科学ではないと考える人も多いかも知れません。

 

しかし、物体の位置情報が計測されている場合は稀です。

 

犬の因果モデルは、正確な位置情報がなくとも推論が可能です。

 

パ―ル先生は、「因果推論の能力を(中略)機械に模倣させよう」(p.12)としています。

 

これは、AIをつくることを意味します。

 

AIを作るためには、犬の因果モデルを機械に模倣させることが必要になります。

 

因果推論の科学では、犬の因果モデルは、科学に分類されます。

 

実用上、ニュートン運動方程式は、かならずしも、犬の因果モデルより優れているとはいえません。

 

自動運転で使われているモデルは、犬の因果モデルの改良版のはずです。

 

犬の因果モデルの改良は大きなテーマで、パール先生は、「クラクションを鳴らしたとしても、普通の歩行者とウィスキーのボトルを持った歩行者では反応が違うと教えてもらわないと、機械は自分ではわからない」(p.55)といいます。

 

運動方程式の精度をあげる前に、解決すべき問題があります。

 

3-2)経済政策のモデル

 

パール先生は、「(因果推論の科学の)影響範囲は、新薬の開発から経済政策の策定、教育やロボット工学から銃規制や地球温暖化の問題にまで広がっている」(p.12)といいます。

 

黒田東彦日銀総裁は、2023年11月1日付の日本経済新聞私の履歴書」の中で、カール・ポパーは「私の知的原点」であると述べています。

 

澁谷浩氏は、黒田東彦日銀総裁は、ポパーの「問題解決図式」についてもよく知っているだろうと考えています。

 

澁谷氏は次のように書いています。(筆者要約)

ポパーの「問題解決図式」の合理的問題解決の流れは、第1に直面する問題の設定から始まり、第2にその問題に対する暫定的な問題解決案を提示し、第3に提示された解決案に対する合理的批判を通じて間違った理論を排除する過程を経て、第4にその過程を通じて出合った新しい問題に到達する。

 

 この過程をらせん状に繰り返していくのが真理に接近する問題解決の方法であり、ポパーが提案する批判的合理主義の進化論的なアイデアを表現している。

 

澁谷氏の表現は、間接的でわかりにくいのですが、筆者には、澁谷氏は、異次元緩和を、暫定的な問題解決案のバージョンアップに失敗した事例と評価しているように見えます。

 

澁谷氏は、異次元緩和の政策評価の後で、次のように書いています。

植田和男氏が日銀総裁を受諾する前に、複数の有力総裁候補が辞退したと聞いている。おそらく辞退した人たちは、日銀総裁になったとしても、黒田・異次元金融緩和が重ねた潜在的巨大損失の尻拭いをする役はごめん被るということであったろうと思われる。

 

なぜならば、異次元金融緩和は合理的な「出口戦略」が初めから存在していない見切り発車だったことに加え「損失を重ねていく過程」にもすでに落ち込んでいたからである。

<< 引用文献

日銀黒田前総裁が見逃した「ポパー理論」 重要なのはデフレ対策ではなかった 日経ビジネス 2024/07/19 澁谷 浩

https://business.nikkei.com/atcl/gen/19/00351/070900149/

>>

 

ところで、筆者の関心は、「黒田氏は、因果推論をしたか」という点にあります。

 

ポパーは、初期の成果である反証主義で著名です。反証主義には、計測誤差や確率の概念が含まれていません。

 

「問題解決図式」は、ポパーの後期の成果です。

 

伊勢田哲治氏は、次のように書いています。(筆者要約)

後期ポパーの哲学は非常に多様な問題を扱いつつ、主体なき知識といったいくつかのキーワードを中心としてつながったゆるやかな体系をなしている。初期の反証主義に比べると後期ポパーインパクトは限られている。後期ポパー哲学では「開かれた宇宙」という非決定論形而上学が展開していく。

 

ポパーは、三世界説を主張する。 世界1とは我々の外にある物理的世界、世界2とは我々の頭の中にある主観的世界である。ポパーは、ヒューム以来論理実証主義者たちに至るまでの経験主義者たちが科学的知識を世界2の中に位置づけようとしてきたことを批判する。

 

ポパーによれば、主観主義者は「どうやってわれわれは世界について知ることができるか」という主観的な形で問題を立ててきたが、そもそもわれわれの頭の中には科学的知識などない。科学的知識は、我々の頭の外に客観的に存在する。ではそれはどこに存在するのか。実はそれが世界 3 と呼ばれる世界である。世界3は人間によって生み出される客観的構造の世界である。幾何学の公理系は典型的な世界3の存在であり、公理系からの定理の導出を支配する規則は世界1の物理の規則でもなく世界2の心理の規則でもなく、論理の規則である。ただ、ポパーは世界3をプラトンイデア界のようなものとして想定するわけではなく、あくまで世界1の中に書物や論文の形で定着させられた形で実在すると考える。世界3は直接世界1に影響を与えることはないが、世界3と相互作用した世界2(われわれの信念)がさらに世界1と相互作用することはあり、その形で世界3は世界1に大きな影響を与えてきた。

<< 引用文献

カール・ポパーの生い立ちと哲学 伊勢田哲治

https://ocw.nagoya-u.jp/files/45/sp_note03.pdf

>>

 

パール先生をはじめ、アメリカの哲学者は、哲学の伝統のプラグマティズムを使います。形而上学である哲学は使いません。形而上学を使わない理由は、第1に、観測不可能なインスタンスは問題にできないからであり、第2に、言語の完全性を前提とした推論は間違えるからです。

 

なお、一般に、哲学とは、「言語の完全性を前提とした推論」になります。

 

パール先生は、新しい言葉(数式)をつくらないと、新しいインスタンスの記述も、推論もできないと考えます。

 

パール先生の哲学の有効性の判定条件は、ミニ・チューリングテストであり、強いAIシステムのコードが書けるか否かです。

 

ポパーの「世界3は、世界1の中に書物や論文の形で定着させられた形で実在する」は循環論法になっていますので、袋小路に入っています。

 

ポパーは、犬の因果モデルが科学であるとは想定していないように見えます。

 

形而上学の典型は、お祈りです。

 

南無阿弥陀仏」を百万回となえれば救われるという理論が、百万遍の地名の由来です。

 

しかし、念仏をとなえる(原因)と、魂が救済される(結果)の間に、因果推論のメンタルモデルがない人は、この因果モデルを受け入れられません。

 

「念仏をとなえれば(原因)、魂が救済される(結果)」という因果モデルでは、「魂が救済される(結果)」は、観測不可能で、検証が出来ません。

 

経済政策の場合、結果は、経済成長や実質所得の増加です。実質所得の増加が観測されなければ、政策を実施する意味がありません。

 

現実には、実質所得の増加が政策目標になっていないので、日本の経済政策では、ポパー流の形而上学が生きている可能性があります。

 

以上のように、黒田氏が、因果推論をしたというエビデンスは見つかりませんでした。

 

日本の経済政策は、パターンマッチング(前例主義)で行なわれている可能性が高いです。

 

パターンマッチングは、学習データと予測の母集団が同じ場合には、高い精度の予測が期待できます。

 

パターンマッチングは、学習データと予測の母集団が異なる場合には、交絡因子の影響があり、まともな予測はできません。

 

教科書にのっている経済政策や、外国の政府が採択してる経済政策を、コピーした場合には、交絡因子の影響があって、確実に予測は外れます(期待された効果がでません)。

 

筆者は、因果推論を禁じるという日銀の伝統が引き継がれていないことを期待しています。

 

パール先生は、「1980年代に、人工知能の研究は、その分野自体が袋小路に入って」(p.172)いたといいます。

 

推論の前提を間違えると、「経済学や、経済政策が、袋小路に入る」ことは十分にあり得ます。

 

パール先生は次のようにいいます。

哲学者たちは、因果関係の概念を数式化するために確率の言語に飛びついて、最近の10年で、その大失敗から立ち直った。残念ながら、計量経済学では未だに、確率を使った因果関係の研究、考察が行なわれています。(p.83、筆者要約)

 

つまり、パール先生は「計量経済学は、因果推論ができない袋小路」にはいっているといいます。

 

ニュートン運動方程式が、かならずしも、犬の因果モデルより優れていないように、経済学のモデルが、犬の因果モデルのような単純な経済の因果モデルに優る保証はありません。

 

我が家の犬が、パターンマッチングする経済学の専門家よりまともな因果推論をしている可能性もあります。

 

下剋上が多発する事態が、考えられます。

 

これが、パール先生が、「因果革命」と「革命」をつける理由です。