西浦モデルでみる東京都の感染者数予測~コロナウィルスのデータサイエンス(その32)

東京都の感染者数の曜日の影響

東京都の感染者数のデータを20日に更新しました。

感染者数のデータは週末は検査数が平日と異なるので、その影響があるとの記事がありましたので、移動平均で曜日の影響を消してみました。

 

図1は、感染者数と経路不明感染者数です。大きな変化はありません。

ただし、データの定義に疑問が生じます。例えば、ある病院で、a1,a2,a3,a4,a5の感染者のクタスターが発生した場合、a1がの感染経路が不明、a2,a3,a4,a5がa1から感染したした場合には経路判明になるのでしょうか。それとも、ルーツのa1が経路不明であれば、5枚全体が経路不明になるのでしょうか。後者の扱いであれば、経路不明者が増えているはずとおもうのですが。公開されている東京都のデータには、退院済みフラグ以外の属性データは消去されていて、こうした点は不明です。

 

f:id:computer_philosopher:20200421095751p:plain

図1 感染者数よ経路不明者数

 

 

図2はいつもの感染者数の時系列グラフに7日移動平均を追加したものです。移動平均の日付は、平均の中央の日を使っています。これをみると、次のことがわかります。

  • 4月9日を境にして大きく変動傾向が変わっている。

  • 4月8日までは、増加傾向である。

  • 4月9日以降は、増加傾向はみられないが、減少はしていない。

4月9日の15日前であれば、3月25日くらいになります。

 

f:id:computer_philosopher:20200421095846p:plain

図2 感染者数の推移 線形軸

 

 

図3は10の対数のグラフです。

 

f:id:computer_philosopher:20200421095921p:plain

図3 感染者数の推移 10の対数軸

 

図4は2の対数のグラフです。

 

f:id:computer_philosopher:20200421100002p:plain

図4 感染者数の推移 2の対数軸

 

図5は、4月11日までの東京都のGoogle Reportのデータをエクセルで描いたものです。

赤い点線の枠で囲んだ3月25日から3月29日にかけて、増加した方が望ましいresidental以外の項目で、減少がみられます。

 

 

f:id:computer_philosopher:20200421100033p:plain

図5Google Reportの東京データ 4月11日版

 

 

将来予測

 

図6はタイムラグの影響を見やすくするために、日付軸の下に15日前の日付をはっています。

4月9日以降の水平部分がほぼ、上記の赤い枠の期間に対応しています。

この赤枠の時の減少率が最大で6割です。

西浦先生のシミュレーションは、概ね8割減で15から30日、7割減で90日、6割では減少しないという結果だったと思います。

3月25日より前の活動制限はおおむね2割減ですから、4月8日までの感染者数の増加率はこの影響と思われます。

4月1日から4月7日までの活動の減少率は、40%前後で、赤い四角の期間より増加しています。

4月8から11日は60%に近づいています。

12日以降のデータはまだ、Googleにはアップさていませんが、国内の駅回りの解析結果をみると東京都は7割減になっているので、11日よりは減っていると思われます。

これから得られる予測は、次になります。

  • 4月22日までは、少し増加か、増減なし

  • 4月23日からは、7割削減で予想される緩やかな減少傾向

減少傾向は、正確には対数軸で考えるべきですが、増加傾向が線形軸でも説明できているので、近傍を線形軸で近似すれば、90日でゼロなら、1目盛りの5日当たり8.3(=150/90*5)人の減少になります。

予測は赤い点線でいれてあります。なお、この予測値は7日移動平均の値なので、最新のデータの4日前までが実測になります。

これは、変動よりかなり小さいので、図6のようにデータからの把握は難しいとおもわれます。

減少が始まるのが4月23日までずれこむのは緊急事態宣言が1週間遅れたことによる時間遅れです。

緊急事態宣言の遅れが経済的なダメージを拡大したことがわかります。

 

 

f:id:computer_philosopher:20200421100125p:plain

図6 将来予測