忘れられたデータの取り方

(帰納を優先すると、データの取得可能性の視点が忘れられます)

 

エビデンスに基づく科学の場合には、最大の関心事は、データの取り方です。

 

次の点が問題になります。

 

P1)測定対象に変化を与えないで、データを取ることができるか。

 

P2)得られたデータのサンプリングのバイアスを最小にできるか。

 

さて、小宮信夫氏は、データを分析して、「夜間に街灯のあるところに、犯罪が多い傾向がある。街灯が犯罪を減らすというエビデンスはみられない」といいます。

 

しかし、犯罪者が、どのようにして被害者のデータを収集するかを考えれば、「夜間に街灯のあるところに、犯罪が多い」のは、自明に思われます。

 

ここで、結果は「犯罪が多くなる」、原因は「夜間に街灯がある」というモデルをアブダプションで検討していることになります。

 

次の2種類のサイトを比較しています。

 

サイトA:夜間に街灯がある

 

サイトB : 夜間に街灯がない 

 

犯人に立場になって、サイトAとサイトBの違いを考えてみます。

 

サイトAでは、犯人には、被害者が見えます。

 

サイトBでは、犯人には、被害者は見えません。

 

犯罪を起こす前に、犯人は、観測によって、被害者の存在を見る必要があります。

 

サイトBでは、被害者の存在は、見えませんので、犯罪を犯すことはできません。

 

観測が可能でも、被害者のデータの密度が問題になることもあります。

 

途上国や一部の先進国には治安の悪い街があります。

 

警察署の前など街の中央部には、被害者になる可能性のある人が大勢います。しかし、警官などの犯罪者を拿捕しそうな人も大勢います。

 

街はずれであれば、被害者になる可能性のある人は、少数になります。しかし、警官などの犯罪者を拿捕しそうな人も少ないです。

 

更に街を外れた森や畑の中には、被害者になる可能性のある人は、殆どいません。警官などの犯罪者の拿捕をしそうな人もいません。しかし、ここで張っていても、獲物の被害者に遭遇できる確率はほぼゼロです。

 

これは、データの密度で考えれば、待っていても、なかなか被害者の候補のデータが入手できないことを意味します。

 

この場合は、被害者の数と警官など犯罪者を拿捕しそうな人の数のバランスが犯罪のリスクを左右します。

 

言うまでもありませんが、街はずれが一番危険です。

 

犯罪者が、どのデータをもとに、行動を起こすかという因果モデルを考えれば、統計解析をする前に、大まかな結果は予測可能です。

 

まず、最初に、データをもとに、法則性を見つける帰納を優先することがベストであるという偏見に、小宮信夫氏も、とらわれているように思われます。

 

アブダプションを使えば、より効率的な分析が可能になります。



引用文献

 

「夜間の犯罪は明るくすることで防げる」は本当か? 街灯の防犯効果について考える 2023/08/14 Newsweek 小宮信夫

https://www.newsweekjapan.jp/komiya/2023/08/post-17.php