護送船団方式のコスト(7)正しい推論と間違った推論

7)正しい推論と間違った推論

 

今回は、推論の正しさを論じます。

 

7-1)冲中重雄教授の最終講義

 

冲中重雄教授は、1963年の東京大学退官時の最終講義にて、自身の教授在任中の誤診率を14.2%と発表しました。患者はその誤診率の高いのに驚いたが、一般の医師はその低いのに感嘆しました。

 

これは、大変有名なエピソードですが、データサイエンティストは、この見解に賛成しません。

誤診率14.2%に価値はないと考えます。

 

誤診率14.2%は、完全情報の世界です。

 

診断した結果を、その後で、追加情報を得て確認した結果です。

 

つまり、ここには、完全情報が得られるという前提があります。

 

1963年に、冲中重雄教授が最終講義をした時には、データサイエンスも、エビデンスベースの医療もありませんでした。

 

実際に、医師が、診断をする時には、不完全情報下の意思決定になります。

 

得られる情報が少なければ、誤診率は高くなります。

 

時間が経過して、得られる情報が増えれば、誤診率下がりますが、治療処置が手遅れになる可能性があります。

 

病状の変化を見ながら(情報の増加を見ながら)、どの時点で、診断を下すかが最大の問題です。

 

誤診率14.2%は、定常過程を前提にしています。

 

コロナウイルスでは、情報を集めて、ワクチンが出来たころになると、対象のウイルスには、変異株ができていました。

 

これは、非定常過程です。このような場合には、誤診率を計算できません。

 

コロナウイルスのワクチン接種は、疫学で、集団を対象にしています。

 

冲中重雄教授の誤診率は、個人の患者を対象にしています。

 

この点では違いはありますが、「完全情報かつ定常過程」と前提とする場合と、「不完全情報かつ非定常過程」を前提とする場合では話が違ってきます。

 

ウイルス感染のモデルは、1原因1結果です。

 

生活習慣病では、原因は複数です。生活習慣病の誤診率は、定義が困難です。

 

がんの発生確率には、生活習慣が作用することがわかっています。がんは、がん細胞を摘出して、組織検査すれば、高い確率で、病名診断が確定できますが、PCR腫瘍マーカーの病名診断の識別率は極めて低くなっています。誤診率は求められるのは、手術した場合に限られます。がん対策では、誤診率よりも、がんの発生リスクをさげる予防に関心が移っています。

 

つまり、医療の現場では、ある次点で、がんのような問題となる結果が発生するリスクを最少化する対策(原因)が追求されています。

 

これから、「不完全情報かつ非定常過程」を前提とする場合には、正しい推論は、問題となる結果を排除する対策(原因)のうち、予想される効果が最大になる選択肢を見つける推論になります。

 

7-2)完全情報と形而上学

 

推論や意思決定をする時点で、得られる情報は不完全情報です。結果(未来に起こること)はもちろんわかりません。

 

歴史を後から、トレースする場合に、得られる情報は、完全情報です。

 

ここで、完全情報とは、全ての情報が入手可能な意味ではなく、時間の経過と共に、情報量が増加しないことをいいます。

 

歴史でも、新しい資料が発見されて、それまでの歴史が書き換えられることがあります。

 

とはいえ、現在進行形で、リアルタイムに情報が増加している場合に比べれば、情報の増加量は少ないので、ほぼ完全情報と言えます。

 

不完全情報下で意思決定すると、悲しくなるほど、打率が下がります。打率85.8%(誤診率14.2%)は夢のまた夢です。3割打者にもなれないと思います。

 

バッターが打席にたつときにできることは、次の1球をヒットさせる確率を最大化させる工夫だけです。ヒットを狙って、バットをふることは、誰にもできます。しかし、ヒットを狙って、バットをふっても、ヒットにはなりません。

 

大谷翔平氏が、記録をつくります。マスコミは、記録をもった大谷翔平氏だから、活躍するはずだと煽ります。これは、完全情報の世界です。大谷翔平氏は、ホームランの記録を狙っているのではなく、毎週毎週体調を整えて、次の1球をヒットさせる確率を最大化させる工夫をしているはずです。体調は変化しますので、体調が悪くなったときには、落ち込みを最小限にする工夫をしているはずです。これは、不完全情報の世界です。ホームランの数は、シーズンが終るまでは、誰にもわかりません。

 

完全情報を前提とする推論は、自動的に形而上学になります。

 

歴史から学ぶ帰納法の多くは、完全情報を前提としています。

 

イマヌエル・カントは、1795年に、「永遠平和のために(Zum Ewigen Frieden)一哲学的考察 Ein philosophischer Entwurf)」を表わします。

 

この本は、副題が示すように形而上学です。

 

形而上学には、目的や理念に表わす効果があります。

 

しかし、形而上学は、リアルワールドとは切り離されています。

 

「永遠平和のために」が直接的に、世界平和を実現する原因になることはありません。

 

「永遠平和のために」は、データサイエンスではありません。

 

科学的な推論ではありません。

 

「永遠平和のために」は科学的には間違った推論になります。これはあくまで科学的かどうかという判断です。

 

「永遠平和のために」は、科学的な目的を設定できていません。

 

科学的な目的は、形而上学の目的とは、全く異なります。

 

科学的な目的とは、因果モデルの結果であって、原因を変化させることで、目標値との偏差が計測可能なものです。

 

「永遠平和のために」は科学的には間違った推論になるという主張には、反対する人も多いと思います。非常識と言われるかも知れません。

 

しかし、「永遠平和のために」が、科学的には間違った推論になるという主張は、パースが、「ブリーフの固定化」で展開している内容です。

 

パースは、プラグマティズムにたどり着く前には、カント哲学を信奉していました。

 

パースは、「ブリーフの固定化」では、形而上学(カント哲学)を、否定しています。

 

ただし、パースの否定とは、正しいか、間違っているかの2分法ではありません。

 

問題を解決する(打率を最大化する)方法として、形而上学(カント哲学)は、科学の方法に、勝てないだろうと予測しているだけです。

 

これは、形而上学が、リアルワールドと切り離されていることを考えれば、自明に思われます。

 

データサイエンスで言えば、科学的に正しい推論とは、不完全情報化下で、問題解決の目標値を最大化できる推論になります。

 

なお、不完全情報化の推論は、情報が追加されるごとに判断が変化します。このような場合には、推論を頻繁にやり直さなければならないので、コンピュータの力を借りるデータサイエンスでなければ、実現が困難です。