(ミームの最大の課題の経験主義を論じます)
1)相関と因果
統計学では、相関と因果は区別されます。
ただし、因果を検証する決定的な方法はありません。
因果を検証する方法の解明は、2000年来の課題でした。
物理学の理論のように、1原因と1結果で構成される確定的な現象であり、ノイズの除去が比較的容易な場合には、科学は因果モデルで大きな成功をおさめました。
前世紀には物理学の成功を目の当たりにして、多くの学問が、物理学をモデルに学問の再構築を行ないました。
物理学は、1原因1結果モデルです。例外的に、複数原因の場合もありますが、原因のパラメータ数は、2、3に止まります。
複数原因と1結果の統計モデルを現象に当てはめるためには、膨大な量のデジタルメモリと処理能力を持った計算機資源が必要です。
今世紀に入って、人類は、歴史上はじめて、この2つのツールを手に入れました。
データサイエンスの誕生です。
人類は因果モデルを検証する方法の解明に近づいています。
ただし、この因果モデルは、ノイズに伴う推定のバラツキを含んだ確率的なモデルです。
統計的因果モデルは、パールによって研究が進められました。
統計的因果モデルの研究は、現在進行中です。
AIによる推論も、統計的因果モデルを使っています。
データサイエンスのモデルを、物理学のような確定的な因果モデルでないと批判する人がいますが、この批判は、物理モデルを基準にした確定論的な世界観(ミーム)に基づいています。
AIが人間を超えるという判定も確定論的な世界観(ミーム)に基づいています。
データサイエンスは、人間には処理できない膨大な量のデジタルメモリと処理能力を持った計算機資源が、人類が手にした時点で誕生しています。
この時点で、人間が、コンピュータに勝てないことは自明です。
2)経験主義(1原因と1結果モデル)の構造
前世紀には物理学の成功を目の当たりにして、多くの学問が、物理学をモデルに学問の再構築を行ないました。
しかし、物理学と同じレベルの成功をおさめた学問はありません。
これは、1原因と1結果のモデルがあてはまるような単純な現象がないことを示しています。
多くの現象は、複数原因と1結果のモデルで検討されるべきです。
とはいえ、前世紀には、膨大な量のデジタルメモリと処理能力を持った計算機資源は手に入りませんでしたので、妥協が必要でした。
しかし、今世紀に入って、この妥協は不要になっています。
この妥協は、経験主義(体験主義)のミームに基づいています。
なお、ここでいう経験主義とは、ヒュームのいう経験主義とは別の用語で、筆者は、本来は、体験主義と呼ぶべきと考えますが、ここでは、普及した経験主義という用語にしたがって説明します。
経験主義は、1原因と1結果モデルです。
経験主義は、IF THEN構文で書ける構造をもっています。
例えば、次のような構造を持っています。
P1: IF(薬を飲んだ)THEN(病気が治った)
がんは日本の国民病です。書店にいけば、がんの本を多数見かけます。
90%の本の内容は、P1のIIF THEN構文で書ける構造の経験主義に基づいています。
しかし、これは、科学的な誤りです。
考えられるデータには、次の4パターンがあります。
P1: IF(薬を飲んだ)THEN(病気が治った)
P2: IF(薬を飲まなかった)THEN(病気が治らなかった)
P3: IF(薬を飲んだ)THEN(病気が治らなかった)
P4: IF(薬を飲まなかった)THEN(病気が治った)
1原因と1結果モデルの因果を検討するためには、この4パターンのデータが必要です。(注1)
例えば、集めたデータの大半が、P4であれば、薬の効果は疑わしいと言えます。
この4パターンのデータをもとに考える検討方法は、エビデンス(根拠)ベース手法の一部です。
EBM(エビデンスに基づく医学)の導入は、30年前から始まり、今世紀に入って普及しました。
医学は、最近になって、P1の経験主義の間違いから抜け出して、科学になりました。
EBMの推論は、検証した母集団に対してのみ有効です。
全ての推論は、母集団とセットで検討されます。
EBMは、統計的因果モデルの一部です。
EBMが普及しているように、医学では、統計的因果モデルは既に市民権を得ています。
一方、市販の健康本の90%は、EBMの基準でみれば、間違いです。
健康本は、ほぼカルト(ほぼカル)ですが、極端なものを除けば、病気の原因にはならないので、放置されています。
カルトの放置には、批判もあり、最近のテレビの宣伝では、「あくまでも、利用者の体験に基づく印象です」というコメントが付けられています。
しかし、このコメントは、EBMの基準では、効果が認められていませんということを意味しています。
テレビの宣伝に、「あくまでも、利用者の体験に基づく印象です」の代わりに、「統計学では、効果が認められていません」と表示すれば、その商品を購入する人はいなくなります。「あくまでも、利用者の体験に基づく印象です」というコメント付きの宣伝を許可するテレビ局には、モラル上の問題があります。
もっとも、利用者の体験に基づく印象を除外すれば、新聞記事の大半は、掲載できなくなります。
新聞やテレビでは、過去の成功事例が紹介されています。
これは、4つのパターンのうち、効果が確認されたP1だけを取り上げる方法です。
エビデンス(根拠)ベース手法で考えれば、統計学的に間違った推論になります。
注1:
4つのパターンの理解は、エビデンスベースの推論のスタートになります。
その理解には、公開教科書の「データ分析のための統計学入門 原著第4版」の「第1章データ分析への誘い(pp.8-41)」を推奨します。
著者は、「統計学で関心のある実際のデータを使って学ぶためには必ずしも数学の深い知識が必要というわけではない」こと、「実際のデータは複雑で、統計学も完全ではないが、統計的分析の強みと弱みを理解すれば、様々な世界を学ぶことに役立つ」という視点で、この教科書を書いています。
訳者の明治大学特任教授かつ東京大学大学名誉教授の国友直人氏は、本書を「日本で流布している多くの大学初級者向けの教科書よりもむしろ適切である」と感じて、アメリカの著者に許可を取り、日本語版を提供しています。
<< 引用文献
データ分析のための統計学入門 原著第4版
著者:David M. Diez, Mine Çetinkaya-Rundel, and Christopher D. Barr
訳者:国友直人・小暮厚之・吉田靖
http://www.kunitomo-lab.sakura.ne.jp/2021-3-3Open(S).pdf
>>
なお、4つパターンでは、力学(物理学)は検証できないことになります。
なぜなら、万有引力の働かない世界は観測されていないからです。
同様に、デカルトのコギトの推論も間違いになります。
万有引力法則は、4つのパターンではなく、重力の強さに基づいて検証されています。
一方、デカルトのコギトには、存在の強度パラメータがないので、物理学の方法は使えません。
3)エビデンスに基づく学習
教育では、予習と復習を推奨しています。
しかし、予習と復習が教育効果をあげるというエビデンスはありません。
教育の内容が、英単語を暗記するといった記憶の場合、記憶は、教材をみる回数が増えれば強化されます。
教育が、暗記である場合、予習と復習には、教育効果があります。
しかし、ビッグデータとクラウドサービスが有効になった結果、記憶の価値は激減しています。
英単語を覚えられれば、その方が生産活動に有利です。
しかし、学習に割くことできる時間が100単位であった場合、何に(どの教科)時間を割くべきかは課題です。
アメリカのような英語ネーティブな学習者は、英語の学習にかける時間を節約できます。
日本人の場合、日本語(国語)と英語を学ぶ必要があります。
IT技術を学習する時間を削ってまで、語学を学習すべきでしょうか。
一方では、IT技術の最新情報は英語で書かれています。
この点で言えば、英語を学習せずに、IT技術を習得することは、困難です。
最も効率的な方法は、英語でIT技術を学ぶことですが、この教育方法がとられることは稀です。
中村紘子氏は、ショパン国際ピアノコンクールの2人目の日本人の入賞者として著名なピアニストでした。
中村紘子氏は、ジュリアード音楽院に進み、ロジーナ・レヴィーン氏に師事しました。
中村紘子氏の著書には、ロジーナ・レヴィーン氏から、ピアノのタッチからやり直すように指摘されたと書かれています。
ロジーナ・レヴィーン氏は、医師のように、ピアニストの問題点を指摘することができました。
ピアニストの経歴では、誰それ氏に師事したと書かれることが多いのですが、師事が、ピアニストの問題点を指摘することにあるのならば、師事した期間による差は小さいので、師事はスキルアップに大変重要なポイントになります。
ロジーナ・レヴィーン氏に師事する場合には、予習の効果はなかったと考えられます。
筆者は、医師の診察を受けるような師事がもっとも効率的な教育方法ではないかと考えています。
それ以外は、AI教師でも十分であると考えています。
予習と復習が教育効果をあげるというエビデンスはありません。
暗記以外の教育効果の計測が可能な方法に何があるのか、筆者にはよくわかりません。
デザイン思考で考えれば、すぐれた作品を作り出す能力の習得が学習の目標です。
すぐれた作品を作り出す能力は、作品を作る能力と作品を評価する能力に分かれます。
この2つの能力が共に優れている人は稀です。モーツアルトは、作曲をすれば、ほぼ、外れがなく、傑作になりました。一方、ベートーベンは、推敲を繰り返しています。普通の人の能力は、べートーベン未満なので、推して知るべしです。
AIが作成した写真や絵画は問題であるという人もいます。
カメラで撮影する写真は、連射モードにすれば、シャッターチャンスを逃すことがありません。
しかし、1秒間に60枚程度の連射ができるカメラもあります。数百枚の連射の写真の中から、ベストな1枚を抽出することは容易ではありません。
似たような写真を比較することは、「ウォーリーをさがせ!」と同じような脳の使用になり、かなりの疲労を伴います。
同様に、AIが作成した数百枚の画像の中から、ベストな1枚を抽出することも容易ではありません。
経験主義は、4つのパターンを無視しています。
人文科学と社会科学と工学の多くの分野は、4つのパターンを無視した経験主義のミームで構成されています。つまり、科学的に間違った内容を教育しています。
科学のミームで判断すれば、経験主義に基づくリベラルアーツの内容は間違い(ほぼカル)です。
現在の教育は、崩壊寸前で、経験主義のミームで、予習と復習を推奨して、お茶を濁しているように見えます。
最後に繰り返しますが、経験主義は、間違い(ほぼカル)ですが、代替手法のデータサイエンスが利用可能になったのは、今世紀に入ってからです。経験主義は、進化の過程で身につけた生存戦略です。データサイエンスが利用可能でなければ、現在でも、ベストな生存戦略であると思います。