実効再生産数と第2波の可能性~コロナウィルスのデータサイエンス(81)

追記:6月15日16時30分

15時30分に、15日の東京都の感染者数が発表されました。

48人でした。実効再生産数1.44の予想通りで、実効再生産数は破壊的な威力があります。

分析はあとでしたいと思いますが、とりあえず、コメントしておきます。

 

実効再生産数の推定サイト

Kevin Systromのアルゴリズムに基づく実効再生産数の推定値が、「Rt Covid-19 Japan」(都道府県別)と「東京都23区市町村別感染者グラフ」(東京都23区市町村別)に公開されています。推定コードは、共に「Rt Covid-19 Japan」のものを共有しており、Kevin SystromのpyMC3を使わない古いアルゴリズムに一部修正しているようです。

このアルゴリズムの場合は、初期値(事前確率)は、感染者が発生するイベント毎にベイズ更新されるようです。このため、感染者数が少ないと、ベイズ更新がほとんどなされず、事前確率の影響が強く残るので、推定値は利用できません

一方、感染者数が多ければ、事前確率の影響が小さくなりますので、実効再生数の推定値は信頼性が高くなります。

具体例をあげますと、実効再生算数の大きい順に並べた場合、

「Rt Covid-19 Japan」(https://rt-live-japan.com/)では1番が、鳥取県、2番が東京都になっています。

「東京都23区市町村別感染者グラフ」(https://stopcovid19.codeforshinjuku.org/)では、1番が瑞穂町、2番が新宿区になっています。

鳥取県の感者数は3人で、瑞穂町の感染者数は1名です。

この2つの自治体の実効再生算数が高く、感染拡大のリスクが、東京都や新宿区より高いことはありえません。これは、計算に与えた事前確率の実効再生産数(=基礎再生算数=3.0)の影響が、残っているためです。この点に、考慮して、問題のあるポイントを除いて、使えば、2つのサイトで、大まかな実効再生産数が把握できます。

実は、2つのサイトで計算している実効再生数のうちの半分以上の地点が、ベイズ更新がうまく行われていない例です。この場合には、事前確率の実効再生産数をより小さな値にして、調整すべきですが、この問題は、西浦モデルの抱えている問題そのものでもあります。簡単に言えば、基礎再生産数3.0の西浦モデルは、都都道府県の半分以上では、まったく、使い物にならないことが、「Rt Covid-19 Japan」でわかります。「Rt Covid-19 Japan」は専門家ではなく、ボランィアが運営していますので、ここでは、その努力を評価するとともに、使える部分だけを使っていきたいと思います。

なお、Kevin Systromのアルゴリズムと「西浦モデル」、「Rt Covid-19 Japan」の違いで、現在、筆者が理解できいない点があります。それは、時間遅れの入れ方です。Kevin Systromのサイトでは、最新データが6月13日の場合には、最新の実効再生産数の推定値は、6月8日で、5日間のずれがあります。西浦資料では、感染から、発病までの時間遅れを、5.6日としています。つまり、最新のデータを使っても、5日までの実効再生産数しか推定できないはずです。しかし、公開された西浦モデルも、「Rt Covid-19 Japan」も、最新データの日の実効再生産数が推定されています。これは、日付表示の問題かもしれませんが、Kevin Systromの処理が合理的と思います。

ここまでは、前回の復習です。

第2波のリスクエリア

現在の第2波のリスクエリアは、東京都、神奈川県、北海道だけです。

  • 神奈川県

神奈川県は、そのアラートの基準を東京都と神奈川県の感染者数の合計で、経路不明者においています。つまり、神奈川県単独では、第2波のリスクを評価できないと判断しています。

「Rt Covid-19 Japan」の神奈川県の実効再生数の推定値は、0.42です。

図1をみると、ここのところ、感染者数は減少傾向が続いていて、実効再生数は、これに対応しています。

一方、Google Transitのデータでは、これから、行動制限が緩んできます。しかし、実効再生産数が0.42ですから、神奈川県は、当面は、感染者が増加することがないことがわかります。

なお、東京都からの流入は、モデルには入っていないので、その点は監視する必要があります。

 

f:id:computer_philosopher:20200615095202p:plain

図1 神奈川県の感染者数の推移

 

  • 東京都

「Rt Covid-19 Japan」の東京都の実効再生数の推定値は、1.44です。

「東京都23区市町村別感染者グラフ」の新宿区の実効再生数の推定値は、1.28です。

「東京都23区市町村別感染者グラフ」の渋谷区の実効再生数の推定値は、0.63です。

これから、今後、東京都は、感染者数が、増えること、ホットスポットは新宿区に集中していることがわかります。

なお、統計処理をする場合、時間、空間的に狭いエリアの値が、広いエリアより極端にでることが普通です。

実効再生産数が1より大きい場合、

新宿区の実効再生産数 > 東京都の実効再生産数

になるのはずです。ここでは、逆転しているので、問題がある可能性があります。

 

f:id:computer_philosopher:20200615095255j:plain

図2 東京都の感染者数の推移
  • 北海道

「Rt Covid-19 Japan」の北海道の実効再生数の推定値は、0.38です。

これは、図3の増減とは傾向が合いません。タイムラグの問題かもしれません。

北海道は、図3では、第2は波のリスクが拡大しているように見えますが、実効再生産数では、当面は問題がないことになります。

 

f:id:computer_philosopher:20200615095331p:plain

図3 北海道の感染者数の推移

 

まとめ

2つのサイトの実効再生算数をチェックしてみました。

比較すると、多少不自然なところがあるので、バグの可能性もありますが、もう少し、追跡を続けたいとおもいます。

第2波のリスクを評価する情報源としては最も有望なので、、サイト公開者に敬意を表したいと思います。

第2波のリスクは東京都庁がある新宿区に集中しているので、選挙もにらんだ対応を見守りたいと思います。

引用

グラフの見方は、コロナウィルスのデータサイエンス(77)を参照してください。

https://www.google.com/covid19/mobility/ Accessed: <2020.06.10>.

https://www.apple.com/covid19/mobility 6-2version Accessed<2020.06.11>.

  • Rt Covid-19 Japan

https://rt-live-japan.com/

https://stopcovid19.codeforshinjuku.org/

  • Kevin Systrom

https://rt.live/