ソリューション・デザイン(3)

(3)データサイエンス科学革命

 

(Q:理論科学とデータサイエンスの違いを説明できますか)

 

1)AIより重要なこと

 

巷(ちまた)には、AIが仕事を奪うとか、10年後にも続けられる仕事は何かといった話題にあふれています。

 

開発途上国の都市では、時代が進むと、交通手段の中心が、自転車、バイク、自動車と変化することがあります。

 

AIが仕事を奪うと考える場合には、交通手段の変化のように、ある手段が別の手段にとって代られるという暗黙の了解があると思われます。

 

しかし、このイメージは、誤解を招くと思われます。

 

というのは、「自転車=>バイク=>自動車」という視点は、部分的なパーツの入れ替えにすぎません。

 

AIが実現している背景には、データサイエンス革命があります。

 

科学革命が、生活を変えてしまったことは広く認識されています。

 

理論的な科学は、物理学を中心とする学問体系ですが、生活を変えた点では、科学による工業化を可能にしたエンジニアリングの影響が絶大です。

 

つまり、科学革命とは、実質的には、エンジニアリング革命と言い換えられます。

 

エンジニアリング革命は、人間の力仕事を機械に置き換え、労働生産性を劇的にあげました。

 

例えば、自動車のエンジンの出力は、馬力で表わされますが、1馬力は、馬1頭相当になります。

 

最近の自動車は、100馬力を超えています。工業化前に、馬100頭を利用できる人は、よほどの大地主に限られ、また、馬100頭の維持するためには、多数の人間の世話係が必要でした。

 

データサイエンス革命の結果、AIは、人間の頭脳労働のかなりの部分を代替します。

 

つまり、特定の仕事がAIに置き換わるわけではありません。

 

人間が、脳を使う方法には、幾つかのパターンがあります。

 

AIの機械学習は、この人間が脳をつかう方法のなかで、コンピュータにモデル化しやすい部分を模倣しています。そして、模倣が成功した場合には、扱うことの出来るメモリの上限、情報処理速度が人間をはるかに超えていますので、AIは、人間を凌駕する性能を発揮します。

 

つまり、特定の職種がなくなるのではなく、全ての職種において、AIに代替される頭脳労働が出て来ます。

 

何が代替されるかを理解するには、データサイエンス革命を理解する必要があります。

 

2)理論科学革命

 

エンジニアリング革命が大きく進んだ時期は、第2次世界大戦以降です。

 

1959年にスノーが、「二つの文化と科学革命」を出して、エンジニア教育が、経済成長を支えると主張しました。このころには、エンジニアが生産性をあげることが明確になっていました。

 

教科の物理学と世界史を比べると、暗記が必要な内容が多いのは、世界史です。物理学で、記憶すべき公式は、世界史に比べると圧倒的に数が少ないです。

 

これは、エンジニアリングに必要なメモリサイズが小さかったことを示しています。その後、エンジニアリングでも、コンピュータの出現によって、取り扱うメモリサイズは増えましたが、このメモリーサイズの増分は、コンピュータの中にある部分であって、エンジニアの頭の中のメモリーサイズは変わっていません。

 

1980年代のPCの普及から、コンピュータの数と容量が指数的に増えます。1990年頃に、コンピュータのメモリと人間のメモリのコストが逆転します。

 

それまでは、紙に手書き文字で書いて、人間が読んで、まとめることが一番安価な情報処理でした。読み書きができること、基本的なことは記憶しておいて直ぐに引き出せることに価値がありました。

 

ここから、マイクロソフトのグレイが、データサイエンスの確立を提案した「第4のパラダイム」(2009年)まで、20年弱が、データサイエンスの勃興期です。

 

データサイエンスが登場する前の理論科学では、簡単に計算できる問題しか解くことができませんでしたので、統計学は、正規分布を前提とする単純なものでした。理論科学は、電卓で計算できるものでした。計算科学が出てきて、計算制約は、電卓からコンピュータに進化しますが、ICメモリは高価で、計算結果は、アクセスの遅い磁気テープに保存していました。

 

データサイエンスの確立によって、写真や音もデジタル化されています。紙の写真は、デジタル写真になりました。絵画はデジタルペイントになっています。今までは、タブレットが高価で性能が低かったので、デジタルペイントの普及率は低いですが、今後は拡がると思われます。現在の作曲家は、PC上でデジタル作曲ソフトを使って作曲しています。原稿用紙は、殆ど使われていません。文字数をカウントするには、ワープロで十分です。

 

ところが、こうした新しいツールを使う教育は義務教育では全くなされていません。デジタルツールを使いこなせない人は、今度必ず失業しますので、これは、あり得ないことです。

 

デ―タサイエンス革命は、2010年頃に完了しています。

 

勃興期の2010年以前に教育を受けた人は、カリキュラムでは、データサイエンスはマスターしていません。

 

2010年年以降に、データサイエンスのカリキュラムを採用している教育機関は大学のごく一部です。

 

学校教育の教科「情報」を教える教員が足りないそうです。

 

学校教育に、データサイエンスを取り入れるには、数学の統計のカリキュラムが不足しています。情報教科のデータサイエンスサンプルコードは、エクセル、R、Python で書かれています。しかし、これだけ見ても、3種類の言語が混在していて、混乱していることがわかります。



なお、プログラムコードを作成するツールやAIもありますが、コーディングが必須です。

これは、自動翻訳を考れば分かります。

 

自動翻訳を使わないで、全て自前で翻訳している翻訳家はいないと思います。

 

最小限でも、知らない単語の辞書引き代りに、自動翻訳を使っていると思います。

 

これは、自動翻訳が正確か否かの問題ではなく、ツールとして使うと、時間が節約できるか否かという問題です。

 

自動プログラミングも、時間が節約できれば使われます。

 

コードが良くなくて、修正した結果、時間が余分にかかるようなら使わないと思います。

 

つまり、コードを読んで、修正できる能力が不要になることはありません。



3)既に変わっているもの

 

新しいツールがない場合には、それを選択することはできませんが、新しいツールがある場合には、それを使うか、否かは選択の問題です。

 

カーナビの出始めであれば、カーナビを使う人も、使わない人もいました。

より詳細なスマホナビが出てきても、カーナビを使い続けている人もいます。

 

携帯電話が出てきても、固定電話や公衆電話を使う人もいました。

しかし、公衆電話の数は激減しました。

 

スマホが出てきても、携帯電話(ガラゲー)を使っている人もいます。

 

こうした時に、全員が使うまで、待つのは不合理です。

 

一方では、フライングして、全く普及しないツールに飛びつくのも考えものです。

 

ところで、カーナビや、スマホはツールとして意識しますが、チャットGPTになると、競合ツールとは意識されないかもしれません。

 

論破王として知られるひろゆきさんの十八番の台詞は「それって、あなたの感想ですよね」です。つまり、多くのコメントは、エビデンスに基づいていないことを示しています。

 

2022年12月から、サービスを開始したChatGPT(チャットGPT)が話題になっていますが、2023年1月からはPerplexity.ai(パープレキシティ)もサービスを開始しています。

 

チャットGPTは、出典を示しませんが、パープレキシティは、出典を明示します。

 

つまり、エビデンスに基づくか、出典が明らかな見解を求めるのであれば、パープレキシティの方が、マスコミに出ている専門家よりはるかに役に立ちます。

 

チャットGPTも時間の問題で、オプションで、エビデンスや、出典に対応することも可能になると思われます。

 

ここにある状況は、カーナビやスマホと同じです。便利で生産性をあげるツールは出てきています。それを使うか、使わないかはユーザーの問題です。

 

新聞の発行部数は減っています。

 

テレビの視聴者は、ネット配信に流れています。

 

新聞の記事は不正確で、エビデンスは示されず、数字、数式、サンプルコードも出てきません。こうなると新聞で使える内容は、検索のためのキーワードだけなので、見出しがあれば事足ります。

 

海外発信の記事であれば、発信元でチェックしないと、使えません。情報量の半分以上は、英語になっているので、結局は英語のキーワードが必要になります。

 

公衆電話がなくなっていったように、新聞とテレビもなくなっていくと思われます。

 

つまり、チャットGPTなどのAIが出てきた時点で、マスコミに出ている専門家は、競争にさらされています。

 

チャットGTPは、自然言語処理なので、会話の不自然さ、文章に不自然さの有無が問題になりますが、文章を作るために必要なデータを検索してくる能力は、人間を超えています。

 

この能力で判断すれば、マスコミに出て来る専門家と同じように、政府の有識者会議の有識者も、チャットGTPには勝てないと思われます。

 

ただし、有権者は、政府の有識者会議の有識者を選ぶことができないので、有識者が、チャットGTPに置き換わることはありません。

 

スマホがあっても、操作できない人はいます。

 

自動車があっても、運転できない人はいます。

 

同様に、AIツールがあっても、使いこなせない人はいます。

 

チャットGTPは出てきても、使いこなすスキルはゼロにはなりません。

 

自動車で言えば、検索のマニュアル操作が、オートマチックになったレベルと思われます。

 

自動運転レベルにはまだなっていませんのでその点は注意すべきです。

 

データサイエンス革命によって、多くの分野で、データサイエンスのツールは既に、人間に置き替っています。

 

問題はデータサイエンスの発達が不十分な点ではなく、変化を阻害する古いルール、規制、既得権益にあります。それによって、既に変わっているものが変わらなければ、生産性があがりませんので、日本は、OECDの中で、相対的に、GDPが落ち続けます。

 

これが、現在、日本で起こっていることと考えられます。

 

4)A:理論科学とデータサイエンスの違い

 

理論科学の制約を超えたデータサイエンスが、2010年頃には、確立しています。

 

4-1)ツールとの正しい付き合いかた

 

データサイエンス革命は、AIのようなツールを生み出しています。

 

ツールとは正しい(効率的な)付き合い方があります。

 

AIツールとの付き合い方を説明する前に、分かり易い例として、自動車で、論点整理を行います。

 

自動車が普及したことで、次のような影響が出ています。

 

(A1)TPOによっては、使ってはいけないツール(手段)がある。

 

江戸時代であれば、馬が買える人を除いては、移動は、全て足で行いました。西部劇に出て来るような駅馬車もありませんでした。

 

自動車が普及した現在では、遠方に行く場合(TPO)には、足を使ってはいけません。

 

バス、自家用車、鉄道など、選択の幅はありますが、全行程を足だけで行くことはお薦めできません。

 

遠方に足だけで行くことは、効率的ではないので、正しくないと言えます。



(A2)TPOによっては、ツールと競合してはいけない。

 

陸上競技の選手は、一般の人が歩くより速く進むことができます。

 

とはいえ、自動車と競争してはいけません。



(A3)TPOを考えた最適解に従って、ツールと人間の活動を分担して共存しなければならない。

 

自動車では、階段が登れない、狭い路地に入れない、駐車場が必要などの制約があり、万能ではありません。

 

最も効率的な移動は、自動車と足などの他の手段を組み合わせることです。

 

パーク・アンド・ライドは、自動車から、トラムなどの市外電車に乗り換える手法です。

 

ここでは、移動手段は、「自動車+トラム+徒歩」で構成されます。自動車とトラムの間には、駐車場が必要です。

 

この最適な組み合わせは、数学的には、カーナビのルート選択と同じタイプの問題です。

 

カーナビのルート選択では、次のようなオプションがあります。

 

(B1)時間優先(最短時間)

(B2)距離優先(最短距離)

(B3)コスト優先(最少費用)

(B4)環境優先(最少CO2排出量)

 

(B4)は、現在はありませんが、将来考えられるとして、筆者が追加しています。

 

これから、合理的な都市交通計画の立案は、以上の4種類の数学の最適化問題に帰着します。

 

この視点で見れば、現在の都市交通計画は、耐えられない程、不合理です。

 

カーナビで例えば、ナビの性能が悪いので、目的地にいつ到着するかわからない状態です。

 

4-2)問題解決のための合理的な考え方

 

さて、自動車の例から、本題のAIとの付き合い方に戻ります。(A1)(A2)(A3)と同じように、データサイエンス革命以後の(C1)(C2)(C3)の条件を考えます。

 

(C1)TPOによっては、使ってはいけないツール(手段)がある。

 

検索をするのであれば、紙の書籍は使ってはいけません。

 

データを扱う場合には、サンプリングバイアスを避けねばなりません。

 

ハムレットの(To be, or not to be, that is the question)ようなバイナリーバイアスは避けねばなりません。

 

リサーチデザインのない研究は避けねばなりません。

 

(C2)TPOによっては、ツールと競合してはいけない。

 

温暖化計算は、全地球を均質な1塊と仮定すれば、電卓でもできます。だからといって、時間空間分布を考えた温暖化モデルと競合してはいけません。

 

同様に、電卓をたたくようなアナログ思考が勝てない分野では、AIに思考を任せなければならなくなっています。

 

筆者は、読者は、温暖化モデルと電卓の競合は理解できると思っています。

 

一方、AIと人間の思考のどの部分が競合しているかを答えられる読者は少ないと思います。

 

競合部分では、無駄な思考をしていることになります。

 

教育カリキュラムでは、考える力を育てることが目標になっていますが、AIと競合する思考能力に経済的な価値はありません。つまり、考えても、収入が得られません。

 

(C3)TPOを考えた最適解に従って、ツール(AI)と人間(の思考)を分担して共存しなければならない。

 

パーク・アンド・ライドのような単純な場合でも、この問題は解決されていません。

 

2023年現在、このテーマの解決は、困難ですが、避けて通ることはできません。

 

TPOを限定すれば、答えは出つつあります。

 

4-3)「ソリューション・デザイン」の必要性

 

この本(連載)のテーマは、「ソリューション・デザイン」です。

 

「ソリューション・デザイン」は複雑な概念なので、徐々に説明する予定ですが、(C3)は、「ソリューション・デザイン」の一部です。

 

筆者は、データサイエンス革命が起こり、AIが普及してきたことで、正しい(効率的な)思考のルールが必要になっていると考えています。

 

哲学者は、考えれば正解に到達できると考えていました。

 

しかし、自然科学は、「検証のためのデータ(エビデンス)なしに、考えても、出口に到達しない。経験科学の方法には、致命的な欠陥がある」と主張しました。

 

理論科学は、真理探究のための科学でした。

 

しかし、データサイエンスの真理は、花火のように有効期限が短いはかないものです。

 

それでも、データサイエンスが支持される理由は、データサイエンスが、実際の問題を解決して、役に立つからです。

 

そう考えると、仮説と検証というルール以外に、データサイエンスでは、問題解決を効率的に進める効率性のルールが必要になっていると思われます。

 

筆者は、データサイエンスは、問題解決のための新しい思考のルール「ソリューション・デザイン」を必要としていると主張します。