感染者数推定問題~コロナウィルスのデータサイエンス(119)

首都圏の感染者数の推移

図1の感染者数(左軸:10万人当たりの人)7日移動平均でみても、感染者数は7月31日から急増しています。

感染者数からすれば新たなステージに入っています。

そこで、問題となるのは、検査数と陽性率です。

陽性率の課題

感染者数が検査データに対応しているのであれば、報告日時で感染者数を評価することは不合理です。

検査日時または、推定感染日時のデータで評価すべきです。

陽性率のチェックを行うのであれば、感染者数(発表日データ)とは対応しませんので、筆者としては出来れば切り替えたいと考えています。

図2は、陽性率(縦軸:%)と陽性者数(横軸:人)の7日移動平均です。ここのところ、陽性率は上がらずに、陽性者数だけが変動しています。

図3は陽性率(縦軸:%)と検査数(横軸:人)です。Aが5月の連休前のデータ、Bがそれ以降のデータになります。Bを見てください。データは、時間順に線で結んであります。最新のデータがオレンジ色の上の方の6から7%のところにあります。これから、最近は検査数が変化しても、陽性率は6から6.5%付近でほとんど変化していないことがわかります。言い換えると、陽性者数はほぼ検査数で決まってしまうということです。陽性者を含むある母集団で、陽性者数を一定として、検査数(サンプル数)を症状を見て、重度から軽度に順次増加させた場合の陽性率の変動は、図3のグラフの枠の外に緑色の線で書いたように、検査数が増えていけば陽性率は減少するするはずです。図3でこの傾向が見られないことは、検査数が決定的に不足していることを示しています。簡単に言えば、現在の感染者数のデータは、実際の感染者数を反映しておらず、検査数のデータに過ぎない可能性が高いです。そうするとこのデータは、検査対象の選定基準を表したデータになってしまいます。これは半年ぐらい前に、騒がれていた問題点で、図3は、すこしも前に進んでいないことを示しています。実際には、公表されている感染者数の数倍の感染者がいるのではないでしょうか。

これから、数学的には、感染者数の推定問題として、解かれるべき問題があると思われます。なぜなら、政策決定は推定された感染者数によっていると思われるからです。

 

f:id:computer_philosopher:20200802114856p:plain

図1 首都圏の感染者数の推移

 

 

f:id:computer_philosopher:20200802114921p:plain

図2 東京都の陽性率と陽性者数

 

f:id:computer_philosopher:20200802114944p:plain

図3 東京都の陽性率と陽性者数

 

 

  • 都内の最新感染動向

https://stopcovid19.metro.tokyo.lg.jp/

  • NHK コロナウィルス特設サイト

https://www3.nhk.or.jp/news/special/coronavirus/