護送船団方式のコスト（７）正しい推論と間違った推論

７）正しい推論と間違った推論

今回は、推論の正しさを論じます。

７－１）冲中重雄教授の最終講義

冲中重雄教授は、1963年の東京大学退官時の最終講義にて、自身の教授在任中の誤診率を14.2％と発表しました。患者はその誤診率の高いのに驚いたが、一般の医師はその低いのに感嘆しました。

これは、大変有名なエピソードですが、データサイエンティストは、この見解に賛成しません。

誤診率14.2％に価値はないと考えます。

誤診率14.2％は、完全情報の世界です。

診断した結果を、その後で、追加情報を得て確認した結果です。

つまり、ここには、完全情報が得られるという前提があります。

1963年に、冲中重雄教授が最終講義をした時には、データサイエンスも、エビデンスベースの医療もありませんでした。

実際に、医師が、診断をする時には、不完全情報下の意思決定になります。

得られる情報が少なければ、誤診率は高くなります。

時間が経過して、得られる情報が増えれば、誤診率下がりますが、治療処置が手遅れになる可能性があります。

病状の変化を見ながら（情報の増加を見ながら）、どの時点で、診断を下すかが最大の問題です。

誤診率14.2％は、定常過程を前提にしています。

コロナウイルスでは、情報を集めて、ワクチンが出来たころになると、対象のウイルスには、変異株ができていました。

これは、非定常過程です。このような場合には、誤診率を計算できません。

コロナウイルスのワクチン接種は、疫学で、集団を対象にしています。

冲中重雄教授の誤診率は、個人の患者を対象にしています。

この点では違いはありますが、「完全情報かつ定常過程」と前提とする場合と、「不完全情報かつ非定常過程」を前提とする場合では話が違ってきます。

ウイルス感染のモデルは、1原因1結果です。

生活習慣病では、原因は複数です。生活習慣病の誤診率は、定義が困難です。

がんの発生確率には、生活習慣が作用することがわかっています。がんは、がん細胞を摘出して、組織検査すれば、高い確率で、病名診断が確定できますが、PCRや腫瘍マーカーの病名診断の識別率は極めて低くなっています。誤診率は求められるのは、手術した場合に限られます。がん対策では、誤診率よりも、がんの発生リスクをさげる予防に関心が移っています。

つまり、医療の現場では、ある次点で、がんのような問題となる結果が発生するリスクを最少化する対策（原因）が追求されています。

これから、「不完全情報かつ非定常過程」を前提とする場合には、正しい推論は、問題となる結果を排除する対策（原因）のうち、予想される効果が最大になる選択肢を見つける推論になります。

７－２）完全情報と形而上学

推論や意思決定をする時点で、得られる情報は不完全情報です。結果（未来に起こること）はもちろんわかりません。

歴史を後から、トレースする場合に、得られる情報は、完全情報です。

ここで、完全情報とは、全ての情報が入手可能な意味ではなく、時間の経過と共に、情報量が増加しないことをいいます。

歴史でも、新しい資料が発見されて、それまでの歴史が書き換えられることがあります。

とはいえ、現在進行形で、リアルタイムに情報が増加している場合に比べれば、情報の増加量は少ないので、ほぼ完全情報と言えます。

不完全情報下で意思決定すると、悲しくなるほど、打率が下がります。打率85.8％（誤診率14.2％）は夢のまた夢です。3割打者にもなれないと思います。

バッターが打席にたつときにできることは、次の1球をヒットさせる確率を最大化させる工夫だけです。ヒットを狙って、バットをふることは、誰にもできます。しかし、ヒットを狙って、バットをふっても、ヒットにはなりません。

大谷翔平氏が、記録をつくります。マスコミは、記録をもった大谷翔平氏だから、活躍するはずだと煽ります。これは、完全情報の世界です。大谷翔平氏は、ホームランの記録を狙っているのではなく、毎週毎週体調を整えて、次の1球をヒットさせる確率を最大化させる工夫をしているはずです。体調は変化しますので、体調が悪くなったときには、落ち込みを最小限にする工夫をしているはずです。これは、不完全情報の世界です。ホームランの数は、シーズンが終るまでは、誰にもわかりません。

完全情報を前提とする推論は、自動的に形而上学になります。

歴史から学ぶ帰納法の多くは、完全情報を前提としています。

イマヌエル・カントは、1795年に、「永遠平和のために（Zum Ewigen Frieden）一哲学的考察 Ein philosophischer Entwurf）」を表わします。

この本は、副題が示すように形而上学です。

形而上学には、目的や理念に表わす効果があります。

しかし、形而上学は、リアルワールドとは切り離されています。

「永遠平和のために」が直接的に、世界平和を実現する原因になることはありません。

「永遠平和のために」は、データサイエンスではありません。

科学的な推論ではありません。

「永遠平和のために」は科学的には間違った推論になります。これはあくまで科学的かどうかという判断です。

「永遠平和のために」は、科学的な目的を設定できていません。

科学的な目的は、形而上学の目的とは、全く異なります。

科学的な目的とは、因果モデルの結果であって、原因を変化させることで、目標値との偏差が計測可能なものです。

「永遠平和のために」は科学的には間違った推論になるという主張には、反対する人も多いと思います。非常識と言われるかも知れません。

しかし、「永遠平和のために」が、科学的には間違った推論になるという主張は、パースが、「ブリーフの固定化」で展開している内容です。

パースは、プラグマティズムにたどり着く前には、カント哲学を信奉していました。

パースは、「ブリーフの固定化」では、形而上学（カント哲学）を、否定しています。

ただし、パースの否定とは、正しいか、間違っているかの2分法ではありません。

問題を解決する（打率を最大化する）方法として、形而上学（カント哲学）は、科学の方法に、勝てないだろうと予測しているだけです。

これは、形而上学が、リアルワールドと切り離されていることを考えれば、自明に思われます。

データサイエンスで言えば、科学的に正しい推論とは、不完全情報化下で、問題解決の目標値を最大化できる推論になります。

なお、不完全情報化の推論は、情報が追加されるごとに判断が変化します。このような場合には、推論を頻繁にやり直さなければならないので、コンピュータの力を借りるデータサイエンスでなければ、実現が困難です。