Googleのコロナウィルス予測モデル~コロナウィルスのデータサイエンス(155)

Googleのコロナウィルス予測モデルの日本版が公開されました。

微分方程式の基本形は、一般的な感染モデルと同じですが、グループ階層ごとにモデルが分けられています。また、移流項に相当する接触のパラメータが取られていて、全体は、集中定数系のモデルのネットワークを形成しています。

ホワイトペーパーをみると、本家の米国のモデルの1週間予測精度は高いようです。

推定値の傾向

推定の傾向をみると11月17日頃から、感染者数の増加が緩やかになっていく都道府県が多いです。例外は、北海道で、今後も指数的に感染者数が増加する予測になっています。

個別にみると、11月17日の実績(予測値)は次のようになっています。新潟や京都のように、毎日の感染者数が小さい場合には、予測のブレは大きくなります。これは、クラスターが1つ発生すると全体の傾向が変わってしまうので、やむを得ないと思われます。一方、北海道、兵庫県、東京都、神奈川県のように感染者数が多い場合には、予測のブレは小さくなっています。

  • 兵庫県 107人(125人)

  • 新潟県 3+30人(2人)

  • 東京都 298人(286人)

  • 神奈川 (116人)

  • 大阪府 (201人)

  • 北海道 197人(252人)

  • 京都府 30人(8人)

日本の課題

1981年生まれのオードリー・タンが「学校での知識は、ウェブで知り得ることに比べて10年は遅れているように思え」て、学校をやめてしまったのは、14歳の時といわれますので、1995年のことです。1995年は、インターネットが始まって間もないころなので、実際は、もう少しあとの可能性もありますが、少なくとも、今世紀に入った20年前には、「学校での知識は、ウェブで知り得ることに比べて10年は遅れている」ことは事実になっていたと思われます。

今回のコロナウィルスでは、アメリカの場合には、ジョンズ・ホプキンス大学が全世界データベースを作って公開したり、英国のインぺリアルカレッジも独自の情報発信をしています。

これに対して、日本の大学の情報発信は、山中先生らがなさっていますが、どちらかといえば、個人プレイが中心で、国内を対象にしたものが主流です。

オードリー・タンが比較しているのは、欧米の大学と思われますから、コロナ対策を見る限り、日本の技術や大学は、世界から取り残されてしまったと思われます。もちろん、ホワイトペーパーにも、日本人と思われる名前はありますので、個人的には、世界で活躍している日本人データサイエンティストはいると思われます。しかし、そうし人たちは、能力の発揮の場がない日本を離れてしまっているように思われます。

 

 

  • COVID-19 感染予測 (日本版)

https://datastudio.google.com/reporting/8224d512-a76e-4d38-91c1-935ba119eb8f/page/4KwoB?s=nXbF2P6La2M

  • COVID-19感染予測(日本版):ユーザーガイド

https://storage.googleapis.com/covid-external/COVID-19ForecastUserGuideJapan_Japanese.pdf

  • Interpretable Sequence Learning forCOVID-19 Forecasting(ホワイトペーパー)

https://storage.googleapis.com/covid-external/COVID-19ForecastWhitePaper.pdf