7)正しい推論と間違った推論
今回は、推論の正しさを論じます。
7-1)冲中重雄教授の最終講義
冲中重雄教授は、1963年の東京大学退官時の最終講義にて、自身の教授在任中の誤診率を14.2%と発表しました。患者はその誤診率の高いのに驚いたが、一般の医師はその低いのに感嘆しました。
これは、大変有名なエピソードですが、データサイエンティストは、この見解に賛成しません。
誤診率14.2%に価値はないと考えます。
誤診率14.2%は、完全情報の世界です。
診断した結果を、その後で、追加情報を得て確認した結果です。
つまり、ここには、完全情報が得られるという前提があります。
1963年に、冲中重雄教授が最終講義をした時には、データサイエンスも、エビデンスベースの医療もありませんでした。
実際に、医師が、診断をする時には、不完全情報下の意思決定になります。
得られる情報が少なければ、誤診率は高くなります。
時間が経過して、得られる情報が増えれば、誤診率下がりますが、治療処置が手遅れになる可能性があります。
病状の変化を見ながら(情報の増加を見ながら)、どの時点で、診断を下すかが最大の問題です。
誤診率14.2%は、定常過程を前提にしています。
コロナウイルスでは、情報を集めて、ワクチンが出来たころになると、対象のウイルスには、変異株ができていました。
これは、非定常過程です。このような場合には、誤診率を計算できません。
コロナウイルスのワクチン接種は、疫学で、集団を対象にしています。
冲中重雄教授の誤診率は、個人の患者を対象にしています。
この点では違いはありますが、「完全情報かつ定常過程」と前提とする場合と、「不完全情報かつ非定常過程」を前提とする場合では話が違ってきます。
ウイルス感染のモデルは、1原因1結果です。
生活習慣病では、原因は複数です。生活習慣病の誤診率は、定義が困難です。
がんの発生確率には、生活習慣が作用することがわかっています。がんは、がん細胞を摘出して、組織検査すれば、高い確率で、病名診断が確定できますが、PCRや腫瘍マーカーの病名診断の識別率は極めて低くなっています。誤診率は求められるのは、手術した場合に限られます。がん対策では、誤診率よりも、がんの発生リスクをさげる予防に関心が移っています。
つまり、医療の現場では、ある次点で、がんのような問題となる結果が発生するリスクを最少化する対策(原因)が追求されています。
これから、「不完全情報かつ非定常過程」を前提とする場合には、正しい推論は、問題となる結果を排除する対策(原因)のうち、予想される効果が最大になる選択肢を見つける推論になります。
7-2)完全情報と形而上学
推論や意思決定をする時点で、得られる情報は不完全情報です。結果(未来に起こること)はもちろんわかりません。
歴史を後から、トレースする場合に、得られる情報は、完全情報です。
ここで、完全情報とは、全ての情報が入手可能な意味ではなく、時間の経過と共に、情報量が増加しないことをいいます。
歴史でも、新しい資料が発見されて、それまでの歴史が書き換えられることがあります。
とはいえ、現在進行形で、リアルタイムに情報が増加している場合に比べれば、情報の増加量は少ないので、ほぼ完全情報と言えます。
不完全情報下で意思決定すると、悲しくなるほど、打率が下がります。打率85.8%(誤診率14.2%)は夢のまた夢です。3割打者にもなれないと思います。
バッターが打席にたつときにできることは、次の1球をヒットさせる確率を最大化させる工夫だけです。ヒットを狙って、バットをふることは、誰にもできます。しかし、ヒットを狙って、バットをふっても、ヒットにはなりません。
大谷翔平氏が、記録をつくります。マスコミは、記録をもった大谷翔平氏だから、活躍するはずだと煽ります。これは、完全情報の世界です。大谷翔平氏は、ホームランの記録を狙っているのではなく、毎週毎週体調を整えて、次の1球をヒットさせる確率を最大化させる工夫をしているはずです。体調は変化しますので、体調が悪くなったときには、落ち込みを最小限にする工夫をしているはずです。これは、不完全情報の世界です。ホームランの数は、シーズンが終るまでは、誰にもわかりません。
完全情報を前提とする推論は、自動的に形而上学になります。
歴史から学ぶ帰納法の多くは、完全情報を前提としています。
イマヌエル・カントは、1795年に、「永遠平和のために(Zum Ewigen Frieden)一哲学的考察 Ein philosophischer Entwurf)」を表わします。
この本は、副題が示すように形而上学です。
形而上学には、目的や理念に表わす効果があります。
しかし、形而上学は、リアルワールドとは切り離されています。
「永遠平和のために」が直接的に、世界平和を実現する原因になることはありません。
「永遠平和のために」は、データサイエンスではありません。
科学的な推論ではありません。
「永遠平和のために」は科学的には間違った推論になります。これはあくまで科学的かどうかという判断です。
「永遠平和のために」は、科学的な目的を設定できていません。
科学的な目的は、形而上学の目的とは、全く異なります。
科学的な目的とは、因果モデルの結果であって、原因を変化させることで、目標値との偏差が計測可能なものです。
「永遠平和のために」は科学的には間違った推論になるという主張には、反対する人も多いと思います。非常識と言われるかも知れません。
しかし、「永遠平和のために」が、科学的には間違った推論になるという主張は、パースが、「ブリーフの固定化」で展開している内容です。
パースは、プラグマティズムにたどり着く前には、カント哲学を信奉していました。
パースは、「ブリーフの固定化」では、形而上学(カント哲学)を、否定しています。
ただし、パースの否定とは、正しいか、間違っているかの2分法ではありません。
問題を解決する(打率を最大化する)方法として、形而上学(カント哲学)は、科学の方法に、勝てないだろうと予測しているだけです。
これは、形而上学が、リアルワールドと切り離されていることを考えれば、自明に思われます。
データサイエンスで言えば、科学的に正しい推論とは、不完全情報化下で、問題解決の目標値を最大化できる推論になります。
なお、不完全情報化の推論は、情報が追加されるごとに判断が変化します。このような場合には、推論を頻繁にやり直さなければならないので、コンピュータの力を借りるデータサイエンスでなければ、実現が困難です。