コロナウィルスのデータサイエンス(その8)

疑問点を整理する

コロナウィルスのマスコミ報道は、危機をあおるようなものが多いです。

これは、視聴率を稼ぐためと思われます。

また、被害推定は、過少であると非難されますが、過大であっても非難されることは少ないので、話が大きくなります。このパターンでよくあるのは、予防原則といわれる立場ですが、これは、経済的合理性を無視していて、実体経済にダメージを与えます。

マスコミに出てくる専門化のコメントもほとんど使い物にならないと思われます。

医学、疫学、データサイエンスなど、関連する学会は多数ありますがどこもコメントを出していません。

その理由としては、次が考えられます。

  • 炎上したりするリスクを避けている。

  • 判断できるだけのデータがない。

おそらく、主な原因は後者と思います。この状態で、コメントできる人は、かなりいい加減な人だと思われます。

現時点の疑問点を列挙してみます。

  • パラメータ a:発病率、あるいは、健康保菌者の割合が不明である。:コロナウィルスをもらっても鼻かぜ程度でおわってしまう人がいることは確認されていますが、その割合が不明です。特に、若年層は体力があるので、健康保菌者の割合が高いと思われます。発病率は50%とも10%とも言われています。10%であれば、行動制限による抑え込みは不可能と思われます。

  • パラメータ b:検査数と実際の発病者の割合が不明である。:日本は、確認された発病者数は少ないのですが、実際には検査漏れがあるだろうと推定されています。逆に、武漢の初期のデータには、普通のインフルエンザの患者が含まれていたのではないかと疑われています。

  • 行動制限の効果が不明または、公開されていない。:休校や行動制限をしても、上記の2つの問題があれば、その効果は限定的になります。行動制限の効果は、モデルで推定できますが、上記のa,bの値によって、その効果は大きく異なります。どのようなモデルを使って、効果を推定したのか、設定したパラメータはいくつで、どのような感度分析をしたのかが公開されるべきです。

  • 感染者あるいは、経過観察者の管理方法が不明です。:感染者や、経過観察者については、本人の同意が得られれば、GPSデータの提供がなされていると思われますが、この点が全くわかりません。

  • 死亡率のばらつきが不明である。:平均死亡率だけを見れは、コロナウィルスはインフルエンザと大差ありません。実際に、米国は今まで、インフルエンザに準ずる扱いをしてきました。しかし、ある時点で、突発的に死亡者数が増えるようにも思われます。適正な死亡率がいくらか、そもそも平均で議論できるのか不明です。例えば、湖北省とそれ以外の中国の死亡率は大きく異なります。この2つを合わせて平均死亡率をだすよりも、ある条件によって、死亡率は大きくとなるとして、条件別死亡率を推定する方が妥当に思われます。問題は、この死亡率を左右する条件が不明なことです。

  • 中国などのデータバイアスが補正できるのか。:中国のデータは、極めて不自然なので、バイアスがかかっていると思われています。統計学では、こうした場合に、バイアスを取り除く工夫をしますが、このデータは、バイアス補正が可能でしょうか。バイアスのあるデータでは、まともな推定は不可能です。中国以外の国別データも、検体数や年齢構成が違うので、単純に比較できません。WHOはおそらく検体数のデータは持っていると思いますが、どのように基準化されているのでしょうか。

  • 温度ファクターが不明です。:コロナウイルスは一般には高温に弱いので、夏が近づけば、減少するといわれています。しかし、今回は、熱帯雨林シンガポールが含まれています。これが、冷房の影響なのか、今回のウィルスは、高温に強いのかが不明です。

 

追記(3月7日)

WHOは夏になって気温が上がれば、ウィルスがなくなると期待しない方がよいという趣旨のコメントを出したようです。温度耐性の実験はさほど難しくないと思うのですが、データを持っているのでしょうか。

イタリアの死亡者数が197人に増えました。死亡者数に差がある(死亡率が違う)原因は、年齢だけでしょうか。

ジョンホプキンス大学WEBの感染者数のカウントの仕方が変更になったように思われます。

Japanは420人です。

https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

追記の追記(3月7日)

420人は7日の最新のデータで、国内発表と一致していました。

1日で70人増えたため、筆者の勘違いのようです。なお、米国のデータは、州別に患者数が表示されますが、日本は表示されません。

新型コロナウイルス感染症まとめ - Yahoo! JAPAN

 

追記(3月8日)

コロナウィルスには、感染率と死亡率の異なる2つのタイプがあるとい説が出てきたようです。