西浦モデルとは何だったのか~コロナウィルスのデータサイエンス(79)

なぜ、今頃になってかは不明ですが、西浦モデルの詳細が明らかになりました。ここでは、西浦モデルとは何だったのかを振りかえっておきたいと思います。

結論

最初に結論を述べます。筆者の立場は、西浦モデルは問題があったというものです。

問題点の詳細については、以下で、論じますが、それをさておいても、最大の問題点は、

  1. モデルの利用目的(何のためのモデルか)が不明確

  2. モデルの検証がなされない

であったことにつきます。

この際に問題になるのが、モデルの利用目的と独立してSIRモデルありきで議論が進行することです。

SIRモデルでは、この2つの条件が明示されずに、モデルが独り歩きしています。

第1に、全てのモデルは、モデルであって、現実ではありません。モデルは現実の一部を取捨して作成します。

モデルを、複雑にすれば、精度はあがりますが、多少精度が上がっても、モデルは現実とは一致しません。

結局、モデルの良し悪しは、利用目的を基準に判断するしかないのです。

第2に、モデルの検証とは、利用目的に即した再現性があるかということになります。

ですから、西浦モデルは「何のためのモデルか」が明確でないと、モデルの良し悪しを論ずることはできません。

これは、SIRモデルに共通する問題点のように思われます。

同じ、SIRモデルを使って、英国はロックダウンして、スウェーデンはロックダウンしない政策をとりました。

 

あるいは、感染の第2波を予測して、対策を講じるためのツールは必要です。しかし、SIRモデルはこの目的には使えません。この目的に使うのモデルでは、独立変数に行動制限の量を入れて、従属変数に、感染者数が表現されつ必要がありますが、SIRモデルはその形式を満足していません。

他のモデルであるフリストンのモデルは、「首都ロンドンでは、入院患者数が4月5日にピークを迎え、その5日後、死亡者数がピークに達する。5月8日までには状況は改善し、行動制限を緩和できるようになるだろう」と予測しました。実際にボリス・ジョンソン首相が行動制限の緩和を発表したのは5月10日であり、モデルは検証されています。

検証ができない、あるいは、するつもりがないモデルは、科学ではありません。

個別の問題点

1.データの問題点

git HUBにソースコードとデータが公開されました。

データは、5月9日までの15404件です。

データの種類(exp_type)は移入(imported)と国内( domestic)に分かれます。

各データには、日付がついていて、「onset(発病)、confirmed(診断)、reported(報告)」に分かれます。該当件数は「12488、2679、237」です。

これから、発病時を基準に処理していることがわかります。

都道府県名のデータはありません。

5月9日までの、日本国内の感染者数(NHKまとめ)は、reported(報告)基づく集計です。

クルーズ船を除く ただし帰宅後の感染確認は含む条件です。

https://www3.nhk.or.jp/news/special/coronavirus/

感染者数は15896人です。オーダーはあっています。

発病日のデータが初めて公開されました。しかし、既存のデータとのリンク属性はついていません。

2.モデルの問題点

  • コフォートを考慮していますが、その他の属性は考慮していません。

  • スケールファクターの考えは皆無です。

  • 行動制限(接触制限)は実測データにモデルがあうようなパラメータとして入っていません。

  • 実績に対して、実効再生産数でフィットするだけで、因果モデルになっていません。

  • 自然免疫が考慮されていません。

西村先生は、「この式が意味するのは、年齢群別の異質性などを気にしない場合、人口の約60%が免疫を獲得すれば流行が自然に下火になる、というものだ。」といいますが、抗体検査の最大値は、空母のルーズベルトの60%が最大で、実測データは、より小さくモデルは検証されていません。

「年齢群別の異質性などを気にしない場合」という発想は、モデルをっとして現実を見ているから起こる発言です。小学校でも、クラスのサイズを変えていくと、30人くらいでグループが形成されます。昔あった50人のクラスは2グループに分かれます。スケールが変わると、対象の構造が変わり、対処方法を変える必要があることは工学の基本です。SIRモデルは院内感染では検証されているとおもいますが、市、都道府県、国レベルでは、同じモデルはつかえません。データをみると日本を1モデルにしているようですが、この方法では、モデルが検証される可能性はほぼゼロであると思います。

まとめ

今回のウィルス問題では、日本国内の学会のプレゼンスは低かったです。

現在は、Git HUBなどで、情報共有ができるので、学会というシステムが時代に取り残されていると強く感じました。西浦モデルのこの記事も。Gitがなければ存在していません。

 

  • イギリス、都市封鎖発動が1週間早ければ死者数半減できたか ニューズウィーク 2020年6月11日(木)09時50分

https://www.newsweekjapan.jp/stories/world/2020/06/1-154.php

英政府科学諮問委員会の元メンバーで疫学者のニール・ファーガソン氏は10日、新型コロナウイルス感染拡大を抑制するためのロックダウン(都市封鎖)が1週間早く導入されていたら、新型コロナ感染症の死者数を半減できていたとの見方を示した。

  • 【特別寄稿】「8割おじさん」の数理モデルとその根拠──西浦博・北大教授

ニューズウィーク 2020年6月11日(木)17時00分 西浦博(北海道大学大学院医学研究院教授)

https://www.newsweekjapan.jp/stories/world/2020/06/8-39.php

死亡者数の被害想定は、あくまで「流行対策をしない」という仮定の下で計算されているので、実際に観察されたのがそれを下回る700人台(5月中旬時点)の死亡者数であると、「モデルが間違っていた。自粛なんてする必要がない」というような誤解も生じかねない。

COVID19-Japan-Reff

https://github.com/contactmodel/COVID19-Japan-Reff

  • 感染症流行の数理モデル「SEIRモデル」は限界 英国政府に代替仮説を提言する科学者たち

ニューズウィーク 2020年6月8日(月)17時30分 松岡由希子

https://www.newsweekjapan.jp/stories/world/2020/06/seir.php

フリストン教授は、この手法により「首都ロンドンでは、入院患者数が4月5日にピークを迎え、その5日後、死亡者数がピークに達する。5月8日までには状況は改善し、行動制限を緩和できるようになるだろう」と予測。実際にボリス・ジョンソン首相が行動制限の緩和を発表したのは5月10日であり、これまでのところ、フリストン教授の予測は、ほぼ正しい。

一般に信じられている集団免疫理論はどこがおかしいのか免疫の宮坂先生に尋ねてみました(上) yahoo 木村正人 | 在英国際ジャーナリスト 5/16(土) 13:58

https://news.yahoo.co.jp/byline/kimuramasato/20200516-00178807/