コロナ対策とデジタル教科書に見る科学技術立国の終わり(6)

追補:データサイエンスの怖さ

5回目で終わりにするつもりだったのですが、「科学技術立国の終わり」については、コメントすべきことが残っていると考えて補足します。それは、データサイエンスの怖さです。

データサイエンスという名前が出てきたのもやはり、1994年の分岐点頃です。

データサイエンスは、現在では、学問分野として認められていますが、1994年頃には、インターネットも始まったばかり、スマホも、ビッグデータもありませんでした。コンピュータ言語は、Cが基本で、Javaが出てきて、それから、C++に移行しますが、本格的にオブジェクト指向のプログラミングができるようになるのは、2000年以降です。したがって、黎明期のデータサイエンスの姿が現在とはずいぶん違ったものでした。

1994年頃には、データサイエンスが提唱されたので、データサイエンスの教科書も作られましたが、要するに統計学の教科書にほかなりませんでした。その当時、統計学は、フィッシャーから数えても、50年以上の歴史がありましたので、筆者は、その頃、今から、コンピュータサイエンスが、データサイエンスと名前を付けて、統計学に喧嘩を売っても、勝ち目があるのだろうかと思いました。

それから、約25年、四半世紀が経ったわけですが、結果は、言うまでもなく、コンピュータサイエンス、あるいは、データサイエンスの圧勝といってよいかと思います。1994年頃に統計学の教科書に書かれていたことの半分以上は、価値がなくなってしまいました。コンピュータサイエンスでは、知識の賞味期限は7年で半減といわれていますので、25年で半減であれば、緩やかな変化と言えます。ただし、それは、コンピュータサイエンスの世界で生活している人の感覚であって、他の分野では、功成り名を遂げた人が偉いという時間感覚が生き残っていると思われます。

データサイエンスが従来の統計学に圧勝した理由は次にあります。

  • 統計処理の理論を開発した。

  • 実際に処理できるプログラムを構築した。(実装するといいます。)

  • 実際に処理できるハードウェアを構築した。

  • スマホが普及し、ビッグデータを入手できるエコシステムを構築した。

  • ネットワークとクラウド環境を構築した。

  • プログラム・ハードウェア・ネットワークのセットをカプセルした。

  • ソフトウェアを共有し、共同開発できるエコシステムを構築した。

おそらく、従来の学問は理論を作るところで、いったんとまります。かつての統計学もそうでした。理論は理論で、自分で計算することはできないので、教科書の最後には、数表がついていて、数表をを引いたものです。これは、ちょうど、裁判官や弁護士が法律を調べて引用するのと似ています。1994年頃までは、統計家は、数表を引いて、判断をしていました。

コンピュータサイエンスは、「理論+ハードウェア+ソフトウエア」がセットでした。現在では、ネットワークの普及によって、これに、「クラウドビッグデータ」が加わります。システムは、巨大になっていき、それに対応して、標準化とカプセル化がすすめられます。CPUの処理速度は今まで、ムーアの法則と呼ばれる18か月で2倍になる速度で向上してきました。これは、簡単に言い換えれば、データサイエンスでは18か月で時間当たりの労働生産性が2倍になる可能性があることを示します。

運転手の職業は自動運転によってなくなります。自動運転のAIの能力を、人間と比べて、云々するのは馬鹿げています。マラソンの距離を走るなら、オリンピック選手より、自動車が速いに決まっています。それは、人間にある体のサイズや体温などの制約条件が、自動車にはないからです。人間には目が2つしかありませんが、自動運転であれば、10でも20でもカメラを付けられます。安全運転をする場合に、人間にある目は2つという制約は、自動運転にはないのです。それを無視して比較するのはナンセンスです。

自動運転は、目に見えてわかりやすい例ですが、実は、これからは、それ以外の分野でもAIやその背後にあるデータサイエンスに負けて、失業するか、雇用が激減する人が多数出てきます。逆に、こうした労働生産性の改善には、データサイエンスが必須です。データサイエンスに取り残されているということは、日本が、労働生産性の改善に取り残されることを意味します。現在でも、日本も労働生産性は先進国の中では最下位ですが、このまま、データサイエンスに取り組めないと、これからは、日本は、労働生産性で、圏外に落ちてしまい、先進国ではなくなります。

まとめますと、日本の科学技術の多くは、データサイエンスをうまく使っていません。このことは、技術開発をしても、労働生産性が上がらないことを意味します。この方法で、技術開発に予算を投じれば、企業は確実につぶれます。なぜなら、データサイエンスをつかった技術開発は要素の将来のコストダウンによって、労働生産性が上がることが期待出きるからです。日本は、PCなどのIT化の普及が先進国の中で、最下位ですが、この事実と、労働生産性が、最下位であるという事実は対応しています。これは、日本では、年功序列組織の中で、IT化やデータサイエンスに先行しようとすると迫害される状況に対応しています。逆に言えば、年功序列をやめて、給与が労働生産性を反映していれば、IT化は自然にすすみます。データサイエンスの普及は年功序列組織を破壊するので、迫害されるのです。省庁の縦割りは、自動車は運転手が運転するような既存の専門分野が存続できることを前提にしていますが、データサイエンスが入ってくれば、省庁や年功序列は破壊され、転職者が多数でます。しかし、労働生産性をあげるためには、これは、避けて通れない道です。データサイエンスには、それを使える組織には、労働生産性の向上と賃金の上昇をもたらしますが、それを使えない組織を根こそぎ破壊する怖さがあります。ただし、公務員は、赤字がないので、組織の変化が止まっています。