統計法則と個人の判断~コロナウィルスのデータサイエンス(149)

コロナウィルスについて、感染者数とか、陽性率、年齢別の死亡率といった数字が独り歩きしてるので、よい機会なので整理をしておきます。

統計法則について、正しい理解をするのは、統計学的な知識が必要ですが、統計学的な知識は、実は、常識とは異なり、ある程度の学習が必須です。

分かりやすい例として、ガンの余命をあげてみます。例えば、「あなたの余命は1年です。」といわれた場合に、これは、1年後に50%の確率で死亡していることを意味します。

まず、日本語の「命は1年です。」という表現は、1年後に100%の確率で死亡することを意味するので、間違った解釈をしている人も多くいます。民間健康法の本で、「私はガンで余命1年といわれたが、この健康法で3年経っても生きている」みたいな本があふれています。こうした勘違いはないとします。

次に、余命1年の場合に、1年後の自分を想像してみます。この場合に、1年後には、生きている(生存確率1.0)か、死んでいる(生存確率0.0)かの2つの状態しかありません。確率0.5で生きていることはありえません。多くの人は、ここで思考停止に至ります。中には、上記の勘違いをして納得する人もでてきます。これは、哲学者のヒュームが提示した問題です。余命は1年は、if-thenで条件付き命題にすれば「If 1年経ったら then 50%生存している」と書けます。これは、同じような病状の患者を100人集めてくれば、1年後には、50人が生きのこっているという意味です。この命題は、「同じような病状の患者を100人」に対しては意味のある推論になります。しかし、個人に対しては意味のある推論にはなりません。つまり、命題と命題が成立する要素の集合はセットで考えないと意味がありません。これは、統計学では、母集団の推定問題に(母数推定)対応します。統計学の命題は、検討された母集団に対してしか当てはまりません。

医師が、あなたの余命は1年ですといった場合には、「あなたのような病状の患者集団に対する余命は1年です」と言っていることになります。半年たった時点で、あなたが、「あなたのような病状の患者集団」に属してるかは、別問題です。半年たった時に生き残っていれば、命題を適用する集合は、「あなたのような病状の患者集団」から、「半年生き残ったあなたのような病状の患者集団」に変化して、生存確率の命題(数字)も変化します。統計的法則は、母集団に適用できますが、現在、あなたがその母集団に属している(と思われる)にしても、将来は、母集団が変化しますし、その時に、どの母集団に属しているかは、あなた次第です。統計法則は、母集団に対して当てはまり、その法則の精度は高いですが、あなたが、どの母集団に属しているかについては、統計法則は何もいいません。この点で統計法則は運命ではなく、自由意志と折り合いがつきます。

さて、話をコロナウイルスに戻します。コロナウィルスの場合でも、年齢別の死亡率や陽性率の数字が公表されますが、これらの数字の公表に問題があるとすれば、これらの数字は、個人の行動変容に訴える力が殆どないことです。行動パターンをAからBに変更すれば、感染リスクが何パーセント下がるというように、母集団の変更を促すような表現をしないと、情報が行動変容を引き起こすことはできません。PCR検査が、感染を拡大するという議論が以前にありましたが、この問題は、リスク計算問題にすぎません。PCR検査を受けた場合のリスクと、受けない場合のリスクを計算して、差をとればいいだけです。行動変容は、母集団の選択になるので、母集団ごとに命題のリスク数値が出せれば、簡単に比較できます。情報提示は、行動変容につなげることが望ましいと思います。