日本のAI研究と科学技術研究の現状と課題

2021/08/08の日経新聞1面に「中国AI研究米を逆転」のデータを元に、AI研究の現状を考えてみたいと思います。関連した科学技術もみておきます。

2021/08/11の朝日新聞は、文部科学省科学技術・学術政策研究所が、ほかの論文に引用された回数が各分野で上位10%に入る論文の数(トップ10%論文数)などを調べた結果を、次のように伝えています。


 日本はいまでも研究者数(官民で68万人)と研究開発費(同18兆円)は米中に次ぐ世界3位、年間の論文総数でも4位を占める。

 だが、最新(2017~19年平均)のトップ10%論文数は、共著者の所属機関で国ごとの貢献度を考慮する計上法で3787本となり、首位となった中国の1割程度、主要7カ国(G7)最下位の10位にとどまった。2000年代半ばまでは4位を維持していたが、それ以降、下がり続けている。とりわけ環境・地球科学、工学、計算機・数学の分野で低かった。日本の研究力の低下の要因として、研究時間の減少や博士課程進学者数の減少などが指摘されている。


毎日新聞も同じ発表を報告しています。学術政策研究所の出典が確認できなかったので、ここでは、新聞を引用しました。

さて、「中国AI研究米を逆転」のデータですが、ポールソン研究所の棒グラフは、目視で読み取って数字にしました。

数字は2種類あって以下です。


AIの論文の「数」で中国の存在感が際立つ(2012~2021年)クラリベイトの集計

1位 中国 24万本

2位 米国 16万本

3位 インド 7万本

4位 英国 4.2万本

5位 ドイツ 4万本

6位 日本 3.8万本

7位 フランス 3.4万本

8位 スペイン 3万本

9位 カナダ  3万本

10位 イタリア 3万本

 

AIのトップ研究者の出身地 ポールソン研究所「The Global AI Talent Tracker」「NeurIPS」(2019年)発表を分析

1位 中国 29%

2位 米国 20%

3位 欧州18%(ドイツ5.4% フランス4.6% スペイン4% イタリア4%)

4位 インド8%

5位 カナダ 5%

6位 英国 4%

7位 イラン3%

8位 イスラエル 3%

その他 10%


ポールソン研究所の欧州18%は、クラリベイトの集計データで、国別に配分しています。

2次元の散布図を書きたいのですが、以下のデータは範囲外で、数字がありません。

日本のポールソン研究所

イランのクラリベイト

イスラエルのクラリベイト

この3つには、範囲外の数字を入れます。グラフ作成の目的は、国別のおおまかな位置を知ることなので、取り合えず、順番が逆転しないで表示される数字をいれることにします。また、表示が重なると見づらいので、端数を動かして、グラフの文字ができるだけ重ならないようにします。

欧州については、国別と欧州全体を表示します。ここでは、欧州に、英国は入れていません。

調整後の数字は以下です。

 

クラリベイト ポールソン研究所
中国 24 29
米国 16 20
インド 7 8
英国 4.4 4
ドイツ 4 5.5
日本 3.8 2
フランス 3.4 4.6
スペイン 3.2 4.2
カナダ 2.8 5
イタリア 2.8 3.8
イスラエル 2.2 3.2
イラン 2 2.8
欧州 13.4 18.1

 

図1が、作成したグラフです。グラフの軸は、両対数です。

これから、日本は、範囲外にあることが明白です。

科学技術全般を見ると、次になります。

「日本はいまでも研究者数(官民で68万人)と研究開発費(同18兆円)は米中に次ぐ世界3位、年間の論文総数でも4位を占める」のですが、「日本の研究力の低下の要因として、研究時間の減少や博士課程進学者数の減少などが指摘されている」はエビデンスがない憶測です。はっきりしていることは、大学の業績評価は、論文本数だけですから、「トップ10%論文数」を書いても評価されませんので、ひたすら、改良型の論文を書いて本数を稼ぐことになります。その結果が、「年間の論文総数でも4位を占める」わけです。データから、論文本数だけを評価するというフィルターは十分に有効に機能していることが確認できています。

大学教員の昇格や採用に論文本数を使うというのは手段にすぎません。目的は、理想とする研究を実践できるようなスタッフと環境を確保することにあるはずです。ところが、目的が喪失して、手段だけが生き残っています。

さて、AIに話を戻します。

情報科学の分野では、10から20年毎に、エコシステムが変化します。1990年代は、インターネットとUnixでした。2005から2015年は、クラウドシステムでした。そのあとは、AIです。おそらく、2030年までには、次のエコシステムのフェーズに入るでしょう。

一口にDXの遅れといいますが、遅れという表現が使えるのは5年程度までです。クラウドシステムの実用化に取り残されると、クラウドシステムの技術を習得しても、米国のようにそれで食べていけませんので、専攻する学生が減ってしまいます。米国は副専攻システムをとっていますが、日本は副専攻システムをとりませんので、「技術があってもビジネスで食べていけない=>専攻を希望する学生が減少する」という負のスパイラルに落ち込みます。自動運転などのAIでも規制緩和が進まないので、この負のスパイラルが繰り返されています。こうして、現状は、クラウドとAIに乗り遅れた2周遅れの後進国になっています。

以上は、推測ですが、実際に、クラウドやAIの使える和文の教科書は、ほとんどなく、英文の教科書に依存します。一方、大学で、英文の教科書で授業をしているところは、例外ですから、状況証拠はあります。

米国では、新しいスタイルの実験的な大学をつくることがブームにみえます。名だたる起業家は、新しい大学の立ち上げに参加しています。AI研究の遅れの問題解決には、日本も、新しいスタイルの実験的な大学をつくること合理的ですが、可能でしょうか。

 

f:id:computer_philosopher:20210813091257j:plain

図1 AI研究の国別比較
  • 影響力が大きな論文の数 日本、過去最低10位 中国が初の首位 20201/08/10 毎日新聞

https://news.yahoo.co.jp/articles/835f344cc0e2cea181561c308cf23fb0a3de7cab

  • 注目度高い論文数、中国が初の首位 日本は10位に転落 2021/08/11 朝日新聞

https://news.yahoo.co.jp/articles/e53fd0b2a3c78716de83011ab480c48063ae9e82

  • 中国AI研究米を逆転 2021/08/08 日経新聞1面

 

前の記事

オリンピックは東京都のコロナ感染を拡大させたか~コロナウイルスのデータサイエンス(233) 2021/08/13

 

次の記事

5割削減で東京都の感染拡大は、収まるのか~コロナウイルスのデータサイエンス(234) 2021/08/14