コロナウィルスのデータサイエンス(その24)

リテラシーの問題点

4月5日に東京都の感染者数は143人、経路不明者は92人になりました。

経路不明者の感染は、対数的になるので、対数グラフでみます。

あるいは、感染リスクは、人口あたり感染者数でみます。この場合には、感染者の位置情報ががあれば、市町村単位でリスク評価が可能になります。

ジャッグジャパン株式会社の地図のデータが、現在利用可能なベストのデータと思われますが、東京都は、区別にはなっていません。つまり、今まで公開されているデータでは、情報が不十分なのです。(4月6日訂正)

https://gis.jag-japan.com/covid19jp/?fbclid=IwAR30DDBBnQRcXnIOoqJmjbs-Z4kYIS0LvHMBqwBbORWRV3TpjYstvrrBrE4

このブログでは、東京都発表の感染者数のデータをみていますが、東北大学大学院医学系研究科・押谷先生は、次のデータを使い分けています。

  • 報告日ごとの感染者数

  • 発症日ごとの感染者数

  • 発症日ごとの孤発例数

これらのデータは推定値と思われますが、残念ながら公開されておらず、詳細は不明です。

実は、押谷先生の資料では、3月末には「発症日ごとの孤発例数」が減少しています。

https://www.jsph.jp/covid/files/gainen.pdf

TVや新聞のデータは、全て発生係数を線形軸にプロットしています。

さらに、ほとんどのデータは累積です。

4月3日に東京都知事が記者会会見をして、週明けに、ホテルを借りあげて、症状の軽い陽性患者にうつってもらうといっていましたが、4月5日の感染者数を対数軸で予測すれば、週明けまえにパンクすることは、必然と思われ、やはり、その通りになりました。

図1は東京都の日別感染者数と経路不明感染者数を線形軸でプロットしています。

予測線は3本弾いていますが、線形で考える限り、最悪でも月末までに、日500人に達することはありません。

CNNは「東京で高まる新型コロナへの懸念、方針転換は手遅れか」としています。

https://headlines.yahoo.co.jp/hl?a=20200405-35151883-cnn-int

TVを見ていると、比例、密度、対数は使いません。これはさいしょ、視聴率を稼ぐための方策化とおもっていましたが、東京都の発表などを見ていると、統計的なリテラシーの不足ではないかと、心配になってきました。

 

f:id:computer_philosopher:20200405223225p:plain

図1 東京都の日別感染者数と経路不明感染者数 線形軸


 

図2は東京都の日別感染者数と経路不明感染者数を対数軸でプロットしています。

この予測線では、早い場合には17日に、遅い場合でも、月末には1000人に達します。

wikiでも基本は対数軸で変化率をみています。

https://en.wikipedia.org/wiki/2019%E2%80%9320_coronavirus_pandemic

 

f:id:computer_philosopher:20200405223325p:plain

図2 東京都の日別感染者数と経路不明感染者数 対数軸