経験科学の終わり（２） - computer

（２）アルファ碁の意味するもの

１）アルファ碁

アルファ碁は、2015年10月に、人間のプロ囲碁棋士を互先（ハンディキャップなし）で初のコンピュータ囲碁プログラムとして初めて破りました。

この事件は、AIの進歩と見なされています。

また、人間対AIの比較の視点で、AIが人間をこえた例とみなされています。

しかし、AIが人間をこえたという視点には、2分法なので、バイナリーバイアスがあります。

アルファ碁の事件を、人間とAIとは別の学習の視点で考えます。

人間は、過去の対戦記録を参照しながら、考えながら、対戦を繰り返すことで上達します。

人間の学習は、ヒストリアンで、経験科学の方法によっています。

アルファ碁は、過去の対戦記録も参照していますが、メインは、自己対戦を使った学習です。自己対戦は、囲碁のルールとアルファ碁のアルゴリズムが演繹的に生み出します。学習はデータサイエンスによります。

つまり、アルファ碁の事件は、「ヒストリアン＋経験科学」チームが、「ビジョナリスト＋データサイエンス」チームに負けた事件と言えます。

アルファ碁が、人間に勝った後では、対戦は繰り返されません。

それは、アルファ碁は、その後も学習し続けるので、人間には、逆転のチャンスはないということです。

「ヒストリアン＋経験科学」チームが、「ビジョナリスト＋データサイエンス」チームに負けた後では、その差は、拡大し続けて、逆転は、不可能になります。これは、学習速度の差が原因です。

２）画像識別

AIの技術の中で、画像識別技術は、最近10年間に大きな進歩をとげました。

現在は、AIの画像識別能力は人間を超えています。

今後は、マルチセンサー、マルチカメラを使った画像識別も進むと思われます。

CNNでは、入手したスマホ画像がフェイクか否かを判定するために、画像の位置情報とGoogleMapの衛星写真画像でクロスチェックをかけています。

これも、マルチカメラによる画像識別の例です。

このようなマルチカメラによる画像識別を自動的に行うことで、AIの画像識別能力は人間をはるかに超えてくるでしょう。

2012年に、AIの画像識別は大きく進歩しました。

画像識別は、学習データ画像と検証データ画像を使って、正答率で評価します。

最初は80％だった正答率が、2012年に、デープラーニングで劇的に改善できることがわかり、現在は95％をこえています。人間の正答率は94％なので、人間をこえています。

ここで、人間をこえたか否かというバイナリーバイアスに陥らないことが大切です。

ポイントは正答率です。次の２つの視点で、正答率に注目する必要があります。

（１）正答率の毎年の改善速度

　これは、技術を評価する上で、展望を考えるためです。

（２）人間とAIの正答率の差

　これは、AIの導入判断に使います。

３）正答率の差

DXにおいて、正答率の差は、重要です。

アルファ碁のように、「ヒストリアン＋経験科学」チームの正答率が、「ビジョナリスト＋データサイエンス」チームの正答率に負ける例が出てきています。

2022年時点で、逆転が起こる課題は限定的ですが、「（１）正答率の改善」が毎年されている上に、「ビジョナリスト＋データサイエンス」チームが扱える課題の範囲も毎年拡大しています。

ここで、単純化して、2つの経営方法があると仮定します。

（１）「ヒストリアン＋経験科学」チームの経営

（２）「ビジョナリスト＋データサイエンス」チームの経営

経営も、画像識別と同じように、正答率が計算できると仮定します。

（１）「ヒストリアン＋経験科学」チームの経営の正答率は、経営者の能力によってばらつきますが、毎年ほぼ一定です。

（２）「ビジョナリスト＋データサイエンス」チームの経営の正答率は、学習によって毎年向上します。アルファ碁のように、ある時点で、人間の判断をこえる可能性があります。

ここで、仮に、「ビジョナリスト＋データサイエンス」チームの経営の方が、正答率が2ポイント高いと仮定します。

この場合、「ヒストリアン＋経験科学」チームの経営の企業は確実につぶれると予測できます。

この2％の正答率の差は、企業経営の上で、複利計算で聞いてきます。

AIによる自動運転自動車は、生産性を向上しますが、その効果は、単利計算でしかありません。

DXにおける最重要課題は、複利計算効果が生じる企業経営に、「ビジョナリスト＋データサイエンス」チームをどのように、組み込むかです。

「ビジョナリスト＋データサイエンス」チームは、データドリブンです。

データがないところでは、効果がありません。

４）データサイエンスの例

コロナウイルスの専門家のアドバイスの評価の例で説明してみます。

コロナウイルスの対策で、中国のような厳しい封じ込めをしないといけないといった専門家がいます。

その後の経緯を振り返ると、厳しい封じ込めの必要があったとは思われないので、「専門家の言うことはあてにならない。話半分に聞いておくべき」といっている人がいます。

これは、経験科学のアプローチですが、エビデンスデータを無視しています。

データサイエンスでは、まず、専門家の意見が、信頼できるエビデンスデータに基づいているかを判断します。

コロナウイルス対策で、イスラエルは、カルテデータベースの構築を行っています。

日本では、カルテのデータベース化は、これからです。カルテデータベースがあれば、ワクチン接種後の副反応については、全数データが回収できます。イスラエルはこれを実施しているはずです。ワクチン接種に行くと、副反応の確率の説明をうけますが、これは、日本のコロナワクチン接種のデータではありませんが、気にする人は少ないです。

データサイエンティストは、対象（専門家のアドバイス）を、コロナ対策モデルを想定して、モデルの正答率をあげるために、利用可能なデータか判断します。正答率を少しでもあげられるデ―タであれば、専門家のアドバイスは使えるデータになりますが、そうでなければ、使えないデータであり、検討の対象外になります。このような、データに基づく政策判断モデルの学習という視点で対象を判断することで、コロナ対策モデルの正答率を次第にあげることができます。失敗の事例は、学習データに使えれば、価値がありますが、学習データに使えなければ、価値がありません。コロナウイルスについては、エビデンスデータが余りに少ないので、専門家のアドバイスはエビデンスに基づくとは言えず、学習データに使える事例にはならないと思います。

マスコミは、専門家の意見を求めることが好きですが、エビデンスデータがなければ、専門家が正確な判断をすることはありえません。患者をみないで、あてずっぽうで、病名をいっているだけです。クイズ番組と問題解決を混同すべきではありません