計算論的思考の哲学(4)Head First

(「因果論的思考法」が多いので、科学的な「統計的思考法」するためには、意識して、ノイズを排除することが必要です。)

統計的思考

プログラミングの入門書に、Head Firstシリーズがあります。このHead Firstの意味は、まず、背景や、概念を理解してから、コンピュータ言語の個別のコマンドなどの文法規約を学習するスタイルです。

「計算論的思考の哲学」は、「Head First 計算論的思考」のようなものです。

つまり、科学的な「統計的思考法」をする場合、対象とする現実の世界に、「統計的思考法」を当てはめる方法には、複数の選択肢があります。

この部分は、アートになります。「科学的」と聞くと、物理学のように、現象は1つの間違いのない式で表されるような印象を持つかもしれませんが、「統計的思考法」は、データが不十分であったり、不完全であったりする場合に、使う手法ですので、手法には、複数の選択肢があります。

「統計的思考法」の結果は、確率で表されます。

これには、慣れが必要です。

天気予報

現在の天気予報は、確率で表現されます。

予測値は、複数の組織で発表していて、公的見解である気象庁の打率が、民間の予測会社の打率より常に高いわけではありません。

毎日、こうした情報に接しているとそれが、当たり前と感じますが、確率予報と民間予報が行われる前を考えれば、予報の世界は大きく変わっています。

天気予報は、科学的「統計的思考」が、適用された例です。

予報の精度は、改善されて、少しずつ良くなります。

Head Firstの計算論的思考をマスターすると、物事を統計的に見ることができるようになります。

絵画

古い絵が見つかった場合、今までは、専門家の鑑定によれば、レンブラントに真筆であることがわかったといった表記でした。これが、最近では、60%の確率で、レンブラントの真筆であると判断されたという表記になりました。これは、画像データ、画材データ、炭素年代法のデータなどを使って、統計解析した結果です。

人間の専門家との比較検討事例があるか、知りませんが、類似の事例を見れば、統計解析が、専門家の勘に負けることはないと思われます。

なぜなら、統計解析の中でも、AIに関する手法は、学習しますので、精度は少しずつ良くなります。これは、人間には難しいです。人間も最初は学習効果がありますが、あるレベルをこえると向上は、困難になります。

裁判

裁判は、基本的に、白黒のはっきりしない案件を扱います。白黒をはっきりさせることのできるだけのデータがない場合に、裁判が行われる訳です。

裁判官の判決をアルゴリズム化する作業を考えると、これは、単純なアルゴリズムでは、データ不足で、答えが出ないような案件です。計算論的思考では、「garbage in, garbage out」と考えますから、ろくな証拠がなければ(garbage in)、ろくな判決はでない(garbage out)はずです。この条件で、確率表現が許されないことは、「統計的思考」は信じられない非科学的なアプローチになります。

カーネマンが、「ノイズ」で、この問題を詳しく、扱っていますが、裁判官の判決には、ノイズが多く、同じ案件でも、裁判官によるバラツキ(ノイズ)が大きな惨憺たる結果になっています。

よく、「AIは人間に追いつくか」という設問が、なされますが、この設問は、「人間の活動に、ノイズが少ない」場合にのみ、意味があり、ノイズが多い場合には、アルゴリズム(AI)が、人間に対して、圧勝になると、カーネマンはいっています。

なお、白か黒かという判別問題は、データサイエンスでは、基本的な問題の一つで、過去の20年間に、洗練された手法がいくつも開発されています。

オリンピック

オリンピックで、何色のメダルが取れるかは、確率現象です。銀メダルの選手とのスコアの差が、大きければ、再度試合をしても、同じ選手が、金メダルを取れるでしょうが、差が小さい場合には、逆転しても不思議ではありません。

金メダルの価値は、銀メダルとのスコアの差によります。

競技に参加して演技することにノイズがある以上、全てが実力の競技はありえません。

ノイズのみでできている競技には、ルーレットがあります。オリンピックの競技は、ルーレットではありませんが、ルーレット的な要素であるノイズを排除することはできません。これは、射撃をみれば、わかります。

「統計的思考法」でいえば、メダルの色よりも、ノイズの少ない世界ランキングの方が、はるかに信頼できるデータです。

まとめ

科学的な「統計的思考法」ではなく、「因果論的思考法」が、多いことがわかります。