GoogleDataの更新(104の訂正)~コロナウィルスのデータサイエンス(105)

東京都の検査数と陽性率

東京都の陽性率に対する検査率の問題について、(104)で論じたのですが、東京経済”「コロナはただの風邪」と言う人が知らない事実”に以下の記述ががありましたので、訂正しました。


まず、「検査数が激増した」という解釈は正確ではない。たしかに6月18日から東京都の公表する検査人数は数字上で増えた。しかし、これは今まで公表範囲に含めていなかった医療機関による保険適用での検査実績を含めるようになったためだ。東京都は検査人数の詳しい内訳を公表していないため、基準変更の前後で増減を比較することはできない。

その後、東京都は過去データを修正し、5月7日まで遡って保険適用分を集計範囲に含めた(正確には、さらに7月に入ってからPCR検査だけでなく抗原検査も「検査人数」に含めるようになった。ただし抗原検査は絶対数が少ないため、検査人数の全体的な傾向にはあまり影響しない)。データ修正後の検査人数を見ると、5月から7月にかけて徐々に増加傾向が見られるものの、ここ最近の陽性者数増加がすべて説明できるほどの違いではない。


要するに、5月7日以降のデータと5月6日以前のデータは同列には論じられないということです。

そこで、どうするかですが、全国の検査数データは4月以降あまり変動していないので、東京都の実際の検索数も、連休の前後で大きく変わることはないだろうと仮定しました。

つまり

東京都の4月の日平均検査数≒東京都の5月の日平均検査数

と考えることにします。

ここでデータをいじじったのは、5月7日からなので、次に修正します。

 

東京都の4月1日から5月6日の日平均検査数≒東京都の5月1日から5月31日の日平均検査数

データの次のA,Bが求まります。

A=東京都の4月1日から5月6日の日平均検査数

B=東京都の5月1日から5月31日の日平均検査数

ここで、4月1日から5月6日のデータにB/Aをかければ、上記の条件にあてはまるデータ数が計算でき、4月1日から5月6日までの修正された陽性率が求まります。

図1はこうして計算した陽性率4と公式の陽性率1を比べたものです。なお、この方法では、移動平均によるスムージングを考慮していないので、5月6日と5月7日の間は不連続になります。

これからみると、現在の陽性率は、前回の非常事態宣言の直前に状態にほぼ一致しています。

図2は、陽性率4について、検査数と要請率をプロットしたものです。データはAとBに分けてあります。Aは、4月1日から5月6日のデータ、Bは5月7日以降のデータです。連休前が高いという傾向は、今回も同じです。

図3は、同じデータで、順序効果がわかるように、データ間を線でつないだものです。

これをみると、オレンジ色のデータの陽性率は、つぶれたらせんを描いています。陽性率は、2.0%、3%、4.5%、6%と不連続に変化し、ある水準で、数日たつと次の水準に移動します。分子軌道の図をみているような感じがします。

次のステージは、同じ間隔であれば、7.5%、その次が9%くらいになります。

次の次までいくと、青の4月の陽性率のピークと同じレベルになります。ただし、青のデータでは、5%、6%、9%にステージがあるようにもみえます。ひょっとすると、次のステージは、7.5%を飛ばして、9%になるかもしれません。

いずれにしても、陽性率が次のステージに達したときには、対策を講じないといけないと思います。

f:id:computer_philosopher:20200714121901p:plain

図1 東京都の陽性率の変化

 

f:id:computer_philosopher:20200714121921p:plain

図2 東京都の陽性率と検査数

 

 

f:id:computer_philosopher:20200714122003p:plain

図3 東京都の陽性率と検査数

 

 

補足:東京都のデータには、細かい点では、おかしなところがまだあります。例をあげると、4月5日のデータは、検査数が62件で陽性が61件です。東京都の陽性率のデータは、移動平均でスムージングされてますので、細かな粗が見えなくなっています。しかし、4月5日の瞬間値とはいえ、陽性率が98%を超えるということは、にわかには信じられません。

 

  • 東洋経済 「コロナはただの風邪」と言う人が知らない事実 7月14日

https://toyokeizai.net/articles/-/362511