東京都の感染者数の最近の傾向と西浦モデルの課題~コロナウィルスのデータサイエンス(その37)

東京都の感染者数の最近の傾向と西浦モデルの課題

東京都の27日の感染者数が39人で、28日は112人なので、マスコミはまた増えたと書いていますが、あまりにひどいのでここで問題点を整理しておきます。

図1は、28日のデータまで入れた7日移動平均データですが、依然としてきれいな低下傾向を続けています。

移動平均をとったgoogle reportも28日までは交通量の減少がつづいています。グラフの交点である29日移動平均までこのトレンドが続くと、90人くらいまでは確実に下がると思われます。なお、29日移動平均は、26,27,28,29,30,1,2日の平均です。図1の最新の値である昨日、28日までのデータを使った移動平均は、22,23,24,25,26,27,28日の移動平均なので、図1では25日の値になります。問題は、14日のタイムラグです。連休の人の出方では、このトレンドが崩れる可能性があります。しかし、感染者数で答えがでるのは5月19日以降になります。

非常事態宣言を継続するかを連休明けに判断するといっていますが、連休明けに判断できるのは、交通量のデータだけです。感染者数に連休の行動が与える影響は2週間後の5月19日でないとわかりません。

したがって、何らかのモデルに、交通量にデータをパラメータとしていれて、2週間後を予測して判断することになります。そして、各段の問題がなければ、西浦モデルが使われるのではないでしょうか。

しかし、図1に見るように、感染者数の減少は交通量の変化が-40%を超え時点では明確に表れています。

図1を見る限り、今までの西浦モデルは実際の交通量減少が感染者数に与える影響を過少評価している可能性が大きいです。つまり、8割減少は安全側の推定ではありますが、最尤推定ではありません。モデルはチューニングしなおして、予測を修正する必要があります。

データサイエンスでいえば、データ、元のモデル、チューニング後のモデルを公開する必要があります。

しかし、今まで、これらは出てきていません。連休後の動向をみたいとおもいます。

 

f:id:computer_philosopher:20200428180128p:plain

図1 東京都の感染者数の最近の傾向