コロナウィルスのデータサイエンス(その9)

途上国のデータ

2月の最初のころ、アフリカの感染者がでないのはおかしいという指摘がありました。最近では感染者がでています。

また、ラオスカンボジアなど極端に中国よりの政策をとっている政府のデータには、バイアスがあるのではないかといわれていました。

しかし、途上国の医療の水準や、生活している人の考え方を、そもそも先進国の視点で見ることには疑問を感じます。

例えば、30年くらい前までは、マレーシアの少数民族であるオラン・アスリ(https://ja.wikipedia.org/wiki/%E3%82%AA%E3%83%A9%E3%83%B3%E3%83%BB%E3%82%A2%E3%82%B9%E3%83%AA)の人は、病気になるのは、悪い魂に取りつかれたからだと思っていました。そこで、病気になると木で人形を彫って、それに悪い魂を乗り移らせて、病気を治すということが実際に行われていました。こうした木彫りの人形は今では手に入りませんが、一昔前には、お土産屋さんでうっていました。

15年くらいまえのラオスでも、やはり病気になるのは悪い魂がのり移ったためであると考えている人が多いと聞いたことがあります。もちろん、今回のコロナウィルスのような場合には、病人に近づかなければ、感染のリスクは低くなるので、これは、迷信というより、過去の経験の中で得られたノウハウのようにも思われます。ですから、それなりの合理性はあります。しかし、感染は広がりませんが、病人の治癒の機会が失われてしまいます。

エルトール小川型のコレラは、法定伝染病ではありますが、主な死亡原因は脱水症状なので、十分に水分補給するか、点滴をすれば、日本では、死亡することはほとんどありません。ところが、病気にかかって、手当してもらえなけれは、助かりません。ですから、一部の途上国では、コレラが発生しても、感染者数が多くなけば、単に下痢として処理し、コレラの感染扱いをしないことがあります。なぜかというと、主な死因は放置されたことにあるからです。

こうした実態を考えると、途上国の中には、よほど死亡率の高い伝染病でなければ、正確なデータはあがってこない国もあると考えなけれはなりません。もちろん、スマホの普及や、識字率の向上、女性の地位の向上などによって、状況は劇的に変化しているので、一律に考えることはただしくありませんが、全ての途上国の人が、近代的な衛生概念を持っていると考えることにもまた無理があります。

検査数の実態

PCR検査の検体数については、厚生労働省が毎日報道しているのですが、これは、1日分のデータしか載っていないので、非常に、扱いづらいです。

東洋経済は、「PCR検査数の推移」として、過去の遡って、毎日のデータを整理していますので、こちらの方が、はるかにわかりやすいです。この「PCR検査数の推移」のグラフを「累計」モードではなく、「新規」モードで表示すると毎日の検査数がわかります。

厚生労働省のデータには、以下の注がついています。

3月6日現在で、総検査数が6647人(陽性333人、有症302人)です。新規では、3月4日のデータが3853人で突出しているので、おそらく、ここで、過去の「濃厚接触者に対する検査数」を一括計上していると思われます。これを除くと、3月6日は699人ですが、3月5日以前では、検査数が200人を超えているのは、2月17日(273人)、3月5日(258人)だけです。100人を超えているのは、2月6日(132人)、2月25日(104人)、2月27日(168人)、2月28日(151人)、2月29日(130人)、3月1日(178人)だけです。検査数のデータは2月6日からしかありません。

注にある、「各自治体で行った全ての検査結果を反映しているものではない」は厚生労働省が、検査実態を把握していないことを意味します。しかし、県や市町村のラインを通じて、把握できていないのであれば、そのこと自体が問題であるともいえます。

また、3月3日以前のデータは発熱や咳などの症状のある人に対する検査と思われますが、4日以降はこの区別がなくなってしまったため、経時変化が追跡できません。これも、データサイエンスとしては、問題があります。

表1に、2月6日から3月3日までの日別検査データを示します。

陽性数と有症数に大きな違いはないので、以下では、陽性数を検討します。

図1はこのうちの陽性率をグラフ化しています。グラフの横軸は2月6日からの積算日数です。

2月12日まではゼロが多いですが、検査数も少ないです。

2月19日のデータが突出しています。

2月19日を除くと、2月13日から3月3日までの陽性率はほぼ、10から30%の間にあり、時系列的な増加はみとめられません。

これから得られる解釈は以下です。

  1. 2月12日までのデータは検査数が少ないですが、利用できると考えれば、陽性率は、12日と13日を境にして、階段状に増加したとみなせます。

  2. 2月12日までのデータは検査数が少ないので、利用できない考えれば、陽性率は、3月3日までの間で増加したとはいえません。

1の解釈は不自然なので、ここでは、2が妥当であると考えます。つまり、陽性率から見ると、3月3日までの間に増加傾向はみられません。

3月3日までの積算で、検査数は、1855人、陽性は253人、有症は230人になりますので、発熱等の症状のある人の陽性率の平均は13.6%になります。

3月4日までの積算には、濃厚接触者が含まれていて、検査数は5690人、陽性は269人、有症は246人になりますので、濃厚接触者を含む陽性率は4.73%になります。

表2は、3月4日以降の検査数です。5日の検査数に濃厚接触者が含まれているとすれば、この値は高いですが、対象が症状のある人だけであれば、特に、高い値ではありません。

3月6日の陽性率は、4.43%でこれは、濃厚接触者を含む3月4日までの積算の陽性率4.73%に近いです。

ですから、検査で陽性になった人の数が増えている原因が、単に検査数が増えているためだけである可能性が否定できないと思われます。

 


注)3月4日以降のPCR検査数は疑似症サーベイランスに加え濃厚接触者に対する検査数も含む(都道府県の回答ベース)。累計の陽性数、有症数はPCR検査数の内数。有症数は患者数と等しい。発表のなかった日(2月8、9、11、15、16日)は前日と同数としている。国内事例のPCR検査実施人数は、疑似症報告制度の枠組みの中で報告が上がった数を計上しており、各自治体で行った全ての検査結果を反映しているものではない。


厚生労働省 報道発表一覧(新型コロナウイルス

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html

東洋経済 ONLINE

新型コロナウイルス国内感染の状況

https://toyokeizai.net/sp/visual/tko/covid19/

 

 

f:id:computer_philosopher:20200308114233p:plain

表1 2月6日から3月3日までの日別検査データ


 

f:id:computer_philosopher:20200308114313p:plain

図1 陽性率の変化

 

 

f:id:computer_philosopher:20200308114357p:plain

表2 3月4日以降の検査数

 

 

 

データの更新

ジョンホプキンス大学WEBの感染者数が変更になったので、データを更新しておきます。

表3は湖北省の死亡率の推移で、2つの死亡率は収束傾向にあります。

 

f:id:computer_philosopher:20200308114424p:plain

表3 湖北省の死亡率の推移

 

 

表4は国別の感染率(10万人あたり感染者数)です。なお、計算は感染者数が10人以上の国に限定しています。北海道を除けば、日本の人口当たり感染率は高くありません。日本からの渡航を禁止する国が増えてきていますが、これは、日本の検査数が余りにすくないため、感染者数のデータに、バイアスがあると判断されているためと思われます。

 

f:id:computer_philosopher:20200308114604p:plain

表4  国別の感染率(10万人あたり感染者数)