GoogleDataの更新~コロナウィルスのデータサイエンス(104)

7月14日:「検査数の問題」は大幅に訂正したので、その部分は(105)をご覧ください。以下のこの節は古いバージョンです。図1のエラーだけは修整して入れかえています。

3日連続で、東京都の感染者数のデータが200人を越えたことと、7月9日で新しいGoogleDataが出たので、データを更新しておきます。AppleDataは今回は使っていません。いつものように、感染者数(左軸:人)と行動制限データは(右軸:%)、7日の移動平均です。行動制限データは、日付を14日進めてあります。詳しくは(77)をご覧ください。

検査数の問題

なお、PCR検査が増えると、感染者数がふえるといわれていますが、これは、1週間程度の短期的な傾向と、週単位の長期的な傾向があります。

短期的な変動傾向は、7日間の移動平均をとっているので、ほぼ、消えていて無視できると思われます。

長期的な傾向は、東京都と全国で異なります。

東京都では、前回の感染者数がピークの頃の4月11日のPCR検査数は344人で、うち159人が陽性で、陽性率は31.7%です。一方、7月8日の検査数はPCRが2866人、抗体検査が218人で合計が、陽性数は、それぞれ、205人と13人で陽性率は5.7%です。検査数は約9倍になっています。

一方全国でみると、4月11日の検査数は7631件で、7月8日は、11897件で、1.56倍にしか増えていません。

東京都で、仮に、4月11日に、7月8日と同じ3084人検査したとします。このうちの344人分はデータがあるので、残りの2740人の陽性率がいくらかという問題になります。もちろん、正解はわかるはずはないのですが、区間推定をすることは可能です。たとえば、4月以降の陽性率の最低値は0.8%です。仮に1%とすれば、検査数が同じなら、27人が陽性のはずです。4%ですと、27x4人になりますので、オーダーとしては、検査数が少なかった影響で、100人の差がでている可能性があります。こう考えると、仮に、検査数の違いの補正ができたとすれば、現在の感染者数が、4月より多いとは言えない可能性があります。

図1は、4月1日以降の東京都の日単位の検査数(PCR+抗体:横軸)と陽性率(縦軸)の関係をプロットしたものです。検査数が500を超えるあたりで、陽性率が、大きく異なります。図は省略しますが、時系列でみると検査数が500を超えたのは、5月の連休あけです。それまでの検査数は、500以下です。つまり、4月の感染者数が多い時の検査数は500未満です。この時のデータは、検査数が少なかった影響を大きく受けています。これは、サンプル数が余りに少ないと、統計的な判断ができなくなる問題で、既に、3月に申し上げていたことです。

なので、前回の非常事態宣言のときのデータと、最近のデータは単純に比較すると、検査数の違いによるバイアスをもろに受けてしまいます。

どのように補正して比較すべきか、あるいは、感染者以外に、より、使いやすいリスク指標は何かが課題になります。

なお、実効再生算数の計算には、感染者数を使うので、4月との比較では、この値も補正しないと適切でなくなります。東京都と神奈川県の最近のHPのは実効再生算数が計算されています。

f:id:computer_philosopher:20200714121741p:plain

図1 東京都の検査数と陽性率(4月1日以降の日データ)

 

東京都と首都圏

話を、感染者数に戻します。図2は、首都圏と東京都の10万人あたり感染者数(左軸:人)とGoogleTransit データ(右軸:%)を示したものです。東京都と首都圏のデータの変化の傾向は一致しています。GoogleTransitはもはや指標としては有効ではありません。

図3は、長期的な東京都の感染者数の推移です。検査数のバイアスを受けているので、感染者数を見るときには、その点を注意する必要があります。

4月の上旬と最近の感染者数の増加のパターンは驚くほど似ています。

短期的に検査数が大きく変化しなければ、増加のパターンは、検査数の影響を感染者数ほど強くうけません。ですので、図3は、現在は、4月上旬と同じ感染者数の拡大要因が働いてる可能性を示しています。

図4に、対数軸のグラフを示します。5月下旬から、ほぼ一定の増加率の変化が続いています。

 

感染者数の増加傾向から見れば、現在は、非常事態宣言に相当するか、数日後には、非常事態宣言が発令されるレベルにあります。もちろん、感染拡大対策としては、非常事態宣言は、費用対効果が最悪なので、他の対策が選択されるべきです。しかし、「感染者数の多さは、検査数の多さによるものであるといった何もしないことの弁明」に、労力をさいて、対策を後回しにすれば、感染拡大は抑えられなくなります。ここには、前回、PCR検査数が少なかった時に行われたと同じ論理のすり替えがあります。

公務員の世界は予算主義なので、仕事を増やしても、給与も使うことのできる経費も増えませんので、予算内で最低限の仕事をすることが、最適解になります(注1:)。このため組織内では、「予算なしには新たな仕事をしないための論理」が幅をきかせます。そのために、問題点のすり替えが多発します。「感染者数の多さは、検査数の多さによるものである」ことは、事実ですが、問題点は、「感染者数が増加した場合に、何を基準に、どのような対策をとるべきか」です。基準も、対策も示されないのであれば、これも、ウィルス対策を後送りするための問題点のすり替えです。

 

f:id:computer_philosopher:20200712082011p:plain

図2 首都圏の感染者数の推移

 

f:id:computer_philosopher:20200712082032p:plain

図3 東京都の感染者数の推移

 

f:id:computer_philosopher:20200712082053p:plain

図4 東京都の感染者数の推移(対数)

 

神奈川県

以下、首都圏の個別の県を見ます。

先に、結論をいいますと、東京都は、6月に入ると感染者数は、緩やかな増加に転じますが、周辺3県では、感染者数は、6月18日以降に増加に転じます。つまり、

  • 周辺3県の感染源は東京都にあります。

  • 東京都は、非常事態宣言以降、感染者数が減少しますが、最終的には、感染源を根絶やしにできていません。感染者数のゼロが続く状態に達しませんでした。

図5の神奈川県は、感染者数は6月下旬に増加に転じています。

注意すべき点は、移動平均をとっても、感染者数の変化がなだらかに、ならない点です。これは、7月7日と4月の中旬にみられ、東京都からの移入の影響です。

f:id:computer_philosopher:20200712082128p:plain

図5 神奈川県の感染者数の推移

 

千葉県

図6の千葉県も感染者数は増加に転じています。増加が始まる時点は、神奈川県より早いです。

f:id:computer_philosopher:20200712082157p:plain

図6 千葉県の感染者数の推移

埼玉県

図7は埼玉県の感染者数の推移です。埼玉県の増加の開始時点は、神奈川と千葉の間にあります。

増加率は大きいです。

f:id:computer_philosopher:20200712082228p:plain

図7 埼玉県の感染者数の推移

注1:これは公務員が、けしからんという意味ではありません。予算なしに仕事をすると、仕事の増大に歯止めがなくなり、破綻してしまいます。民間部門であれば、仕事の増加は、売り上げの増加につながりますが、公共分野は、料金を取りませんので、収入はふえません。今回のコロナウィルス対策で、保健所などの公務員の増員をすべきであると主張するマスコミもいますが、公務員は、ウイルス対策のような非定常業務には最も不適切な組織なので、民間をつかうべきです。PCR検査の増加にも、民間が必要でした。会社の幹部は裁量経費をもっていますが、公務員には幹部でも、裁量経費はありません。IT化が絶望的におくれる理由もここにあります。

 

 

引用

  • 都内の最新感染動向

https://stopcovid19.metro.tokyo.lg.jp/

https://www.pref.kanagawa.jp/docs/ga4/covid19/k-vision/indicator.html

  • NHK 特設サイト

https://www3.nhk.or.jp/news/special/coronavirus/

https://www.google.com/covid19/mobility/ Accessed: <2020.07.11>7-9version.

  • Rt Covid-19 Japan

https://rt-live-japan.com/

https://toyokeizai.net/sp/visual/tko/covid19/