コロナウィルスのデータサイエンス(その2)

前回、死亡率をみるのに、感染者数ではなく、「死亡者数+回復者数」を基準にすべきであると申し上げました。

その後の死亡率を追跡した結果が表1です。ジョンホプキンス大学の元データでも現在では、感染者ー死亡者ー回復者=感染中が表示されるようになりました。

https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

今回は2月28日のデータを分析します。

湖北省の死亡率1は10%以下になりました。一方、死亡率2は逆に、4%を超えました。おそらく、最終的には、データが正しければ、時間がたてば、この2つの値は収束するように思われます。

 

f:id:computer_philosopher:20200229125713p:plain

表1 湖北省の死亡率の推移


 表2は10万人当たり感染率を出してみました。

上記のサイトでは、中国の死亡率データは省毎で、全体集計が見当たらなかったので、除外してあります。

人口当たり感染率が一番高いのは、中国ですが、韓国のレベルは、中国とほとんどさがありません。

一方、死亡者は出ていませんが、感染率では、バーレーンクウェートが大きいことがわかります。

また、イタリーは香港以上に深刻なことがわかります。

北海道の人口は5,268,166人で2月29日の感染者数は51人です。これは10万にあたり、0.97人になり、ほぼ、イタリーと香港のレベルです。

政府は、学校の休校を進めていますが、中国と韓国から人が入ってくれば、防止策にはならないと思われます。

 

f:id:computer_philosopher:20200229184243p:plain

表2 10万人当たり感染者数(2月29日18時訂正版)

 

データが操作されている可能では極めて高いと思われますが、とりあえず、解が求まるか試してみます。

2つの死亡率の時間変化を2次曲線で近似すると次になります。

ここにxは2月1日を第1日とした積算日数です。

 

f:id:computer_philosopher:20200229125907p:plain

近似式

f:id:computer_philosopher:20200229125954p:plain

湖北省の死亡率の推移グラフ


 

1番目の式を微分して、最小値を解くと、30.64になります。これは、30日目(3月1日)に最小値になることを意味します。この時の死亡率1は9.3%です。要するに、2次曲線当てはめでは、死亡率1の今後の低下はあまり見込めないことになります。

f:id:computer_philosopher:20200229125929p:plain

極値

 

やはり、現在のデータで、信頼できる予測値を求めることは難しいことがわまります。

 

 

追記(2月29日18時)

アラブ首長国連邦の死亡者数のデータにミスがあったので訂正しました。(表2を差し替え)

感染率の8時のデータを次に追加しました。

人口当たりでは、韓国が中国を上回りました。

北海道は香港を超えました。

 

f:id:computer_philosopher:20200229184400p:plain

表3 人口10万人当たり感染者数(2月29日18時データ版)