(21)魔法のソフトウェアとAIの得意分野
(生産性が上がるソフトウェアを考察します)
1)魔法のソフトウェア
デジタル企業の中心は、ソフトウェアです。
日本にも、ソフトウェアを作るITベンダーはあります。しかし、ITベンダーとGAFAのビッグテックの生産性は、大きく異なります。
NTTデータでは、人材流出が止まらず、NTTデータはGAFA予備校と言われています。これは、表面的には給与の差ですが、ジョブの内容を考えれば、GAFAは、NTTデータよりはるかに利益率の高いソフトウェアのジョブを提示できていることを意味します。
高い給与を払えば高度人材が集まるという理解は、人文的文化にとどまります。
ソフトウェアには、非常に高い利益率を叩き出す魔法のソフトウェアとそれ以外の並のソフトウェアがあるという事実を認識すべきです。
日本には、ITベンダー以外に、ゲームのソフトウェアを作る企業もあります。ゲームのソフトウェアは、材料費がほぼゼロなので、工業製品に比べて高い利益率をあげています。
ゲームのソフトウェアは魔法のソフトウェアでしょうか。
筆者は、そうではないと考えます。
どのようなソフトウェアが、魔法のソフトウェアであるかという問題は、ソフトウェアを作りながら、生産性の高いデジタル社会の企業(デジタル企業)になれるか、生産性が並の工業社会の企業になるかの分岐点になると考えます。
デジタル社会のデジタル企業は、工業社会のモノづくり企業とは生産性の桁が違います。日本が先進国であり続けるためには、日本にもデジタル企業を作りださなければなりません。
モノづくり企業をいくら作っても、生産性が低いので、先進国からの没落を止められません。
マクロソフトの「第4のパラダイム」に基づけば、それは、データサイエンスを活用して利益を上げる企業になります。ただし、「第4のパラダイム」は、科学パラダイムを論じた本であり、企業経営を論じた本ではありません。
その他にも、この問題を論じた記述があるかもしれませんが、筆者は、その事例を知らないので、以下は、筆者の独自の見解です。
似たような見解が、既に、公開されている可能性はゼロではありませんが、今の時点では、調べきれていません。
2)パターンマッチングと分類
考察に入る前に、データサイエンスの特徴を簡単に整理しておきます。
データサイエンスや、AIは、人文的文化では、「AIがいつ人間を超えるか」、「人間の労働はAIにとって代わられるか」、「新製品は、AIを使っているか」といった1かゼロかのバイナリーバイアスの世界で論じられます。
科学的文化では、計算科学のコンピュータ処理が人間の能力を超えたように、データサイエンスが既に、人間の能力を超えている部分、互角な部分、人間の方が優れている部分をわけて考えます。この3区分もアバウトですが、とりあえず、バイナリーバイアスを回避できます。
2023年に時点で、データサイエンスや、AIが大きく人間を凌駕している分野は、パターンマッチングと分類です。
(1)パターンマッチング
大学入学共通テストでは、マークシートが使われます。これは、鉛筆で塗りつぶしたパターンを読み取り機で判定するもっとも原始的なパターンマッチングです。
郵便番号の文字の読み取りは、もう少し複雑なパターンマッチングです。
現在では、数字のパターンマッチングの公開ライブラリがありますので、数字のマッチングのソフトウェアは、プログラムが出来るれば高校生でも簡単に作れます。
官僚が大好きな前例主義も、現状と前例のパターンマッチングです。
大学入試問題を解く、AIソフトのコアはパターンマッチングです。過去の設問と解答のデータベースを作成して、そこから、機械学習でパターンマッチングを学習します。
画像認識のパターンマッチングでは、写真に何が写っているのか、95%以上の正答率で判別できるようになりました。これは、人間の能力を超えています。
つまり、AIは、パターンマッチングが人間より得意です。
次に、試験問題は何を判定しているのでしょうか。
単語カード(フラッシュカード)のような暗記は、表の単語と裏の単語のペアを記憶します。人間は、努力してペアを記憶しますが、コンピュータは、表の単語と裏の単語のペアをデータに並べて、メモリーに転送するだけです。記憶するための努力は不要です。
試験問題では、表の単語の問に対して、裏の単語を答として書き込みます。
つまり、表の単語をにマッチするペアを探して、裏の単語を書き込みます。
思考問題が中心と考えられる数学についても、和田秀樹氏が数学は暗記であるという受験指導をして有名になりました。
ここで「暗記」というのは、解答のパターンを暗記して、問題を見て、最も近いパターンに当てはめて計算するという意味です。
つまり、現在の大学入学試験は、思考能力を見ているのではなく、パターンマッチングの能力を見ている可能性が高いといえます。
読者は、「このままでよい、そのどこに問題があるのか」と考えられるかも知れません。
問題は、パターンマッチング能力において、人間は、AIに勝てないという点にあります。
入学試験は、AIと競争したら、負けてしまう学生を合格として選抜していることになります。
採点方法にパターンマッチングを使っている試験の場合には、教科にかかわらず、この問題を抱えています。
日本のAO入試は、大学入学共通テストより難易度が低い場合が多く、現状では、優秀な学生を選抜する上でAO入試は、大学入学共通テストの代わりにはなりません。
つまり、今のところ、この問題の解決の目途は立っていません。
(2)分類
パターンマッチングとセットになっている問題が分類問題です。
ある写真を見て、その動物が、チンパンジーであると判別するのは、パターンマッチングです。
同じ写真を見て、その動物が、チンパンジーかゴリラかを判定すれば、分類になります。
(3)学習と正答率
パターンマッチングも分類も、学習データを準備して、機械学習をした上で、成績(正答率)を計測します。
機械学習には、色々な手法(アルゴリズム)がありますが、成績を見て(エビデンスに基づいて)、ベストなアルゴリズムを選抜します。
有罪か無罪かは典型的な分類問題です。
カーネマンは、「ノイズ」の中で、同じデータに基づいて、有罪になるか、無罪になるかは、裁判官によるバラツキが多いという問題を指摘しています。こうした分類の間違いを直すには、恐ろしく単純なアルゴリズムでも、人間よりはましな判断ができるといっています。
データサイエンスでは、データを多次元空間に展開して、分離機(分離アルゴリズム)をつくる手法が一般的です。これは、多次元データの処理になるので、生身の人間の能力を超えています。
カーネマンの「ノイズ」には、裁判官が裁判で、どのようなアルゴリズムを使って、判決を出すのか書かれていませんが、多次元データの処理でないことは確かです。
次元の低いデータ処理アルゴリズムの典型に決定木(デシジョンツリー)があります。
これは、迷路から出口を探すように、2分岐のところで、右か左かの判断を複数回繰り返して、最終的な判断をだすアルゴリズムです。
データサイエンスでは、決定木のアルゴリズムは推奨されません。
それは、このアルゴリズムは、ノイズに対して、脆弱で、ノイズ次第で、分類の結果が直ぐに覆ることが知られているためです。
仮に、裁判官が決定木アルゴリズムを使っていると考えれば、カーネマンが、「ノイズ」の中で指摘したように、裁判官によるバラツキが多いのは当然になります。
データサイエンスでは、決定木のアルゴリズムの欠点を補正する方法も提案されています。
それは、ランダムフォーレストと呼ばれる手法で、ノイズと思われる部分のデータを変化させて、決定木を100回くらい繰り返して、分類結果のバラツキを見る手法です。
裁判官で言えば、100人くらいの裁判官が同じ案件を取り扱って、判決のバラツキを見なさいということになります。
100人の裁判官が協力してくれるとは、思えませんが、ソフトウエアであれば、100回でも、1000回でも簡単に繰り返せます。
データサイエンスによる分類は完全でありませんが、正答率の値は求まっています。
また、この正答率の値は、アルゴリズムとデータの改善によって、常に改善がはかられています。
実際の裁判官の判決にもエラーはありますが、正答率が公開され、その改善が進んでいる訳ではありません。
裁判が、パターンマッチングや分類問題であれば、人間は複雑なデータを扱えないので、原理的に、AIを使う方がベターであると思われます。
これは、アルファー碁と人間の対決のように、ダミーデータを使えば、検討が可能です。
2023年には、アメリカで、初めてロボット弁護士が働いています。しかし、このロボットは、「弁護士の文書のコピー&ペースト作業を代替しているだけです」。
大前研一氏は、次のようなAIツールの利用例を紹介しています。
<==
すでにカナダでは弁護士業務のかなりの部分をAIが代替している。その訴訟のケースをアプリに入力すると、過去の判例に基づいて「裁判に勝てる確率」「妥当な請求額」「争点と法廷で議論すべき順序」などをAIが教えてくれるのだ。書籍やネット上の判例集を紐解いて調べる必要はないのである。今後はAIを駆使できる弁護士しか生き残っていくことはできない。
==>
科学的文化から見れば、法律を作ることは、人間にしかできない重要な役割ですが、裁判の内のパターンマッチングや分類の作業は、原理的に、人間より、AIに向いているように思われます。
もちろん、これは、仮説ですから、別の仮説や、仮説検証が進むべきと考えます。
引用文献
世界初「ロボット弁護士」が来月、法廷で人間を弁護する 2023/01/27 Newsweek 佐藤太郎
https://www.newsweekjapan.jp/stories/world/2023/01/ai-69.php
岸田政権が注力する「リスキリングで資格取得」の時代錯誤 本来学ぶべきスキルとは 2022/10/29 週刊ポスト 大前研一
https://www.moneypost.jp/960065