(THINK AGAINの半分以上は、心理学ではなく、データサイエンスに関係しています)
THINK AGAINを読み終わったので、全般のコメントを書いておきます。
1)心理学か、データサイエンスか
これは、カーネマンの「ノイズ」にも共通していますが、心理学とデータサイエンスの問題を扱っています。
たとえば、P.44には、科学的思考モードをトレーニングしたグループとコントロールグループを比較して、前者の収益が1万2千ドル、後者の収益が255ドル(47分の1)であるという事例が出てきます。
これは、トレーニングコースの効果の検証の視点では、心理学の問題ですが、データサイエンスの理論の効果の検証であれば、データサイエンスの課題です。
47倍は、心理学の研究では大きな違いかもしれませんが、データサイエンスでは、当然の結果です。
THINK AGAINは、文字通り考え直すことをテーマにしています。
サイエンスでは、エビデンスが仮説を支持しない場合には、仮説を再検討(THINK AGAIN)します。
ですから、これは、科学的方法の問題です。
THINK AGAINの例題は、次の(1)です。これは、心理学の課題です。
しかし、(2)であれば、心理学ではなく、データサイエンスの問題です。
同じ結論を出すのに、心理学が必ずしも、必要とは思われません。
(1)科学的方法ができない心理バイアスがあるー>心理学のバイアス矯正セミナーを受講する
(2)科学的方法が使えないー>科学的方法論を習得する
2)確率変数
データサイエンスでは、変数は確率分布をもつ確率変数であると考えます。
例えば、THINK AGAINでは、地球温暖化は嘘か、本当かという例題がでてきます。
ここでの確率変数は、地球温暖化仮説の妥当性と考えられます。
この値が、確率分布を持つことは、左端を0(100%嘘)、右端を1(100%本当)としたグラフを書いた場合に、確率密度のヒストグラムが与えられることを意味します。
事前に確率分布はわかりませんので、ベイズ統計では、それらしい事前確率を与えて、観測データによるベイズ更新を行って、確率分布を修正(更新)します。
それらしい事前確率の選択は、主観ですが、一般に観測される確率分布は、正規分布や、一様分布のようななだらかな変化を持ちます。100%0、あるいは、100%1という分布はまず観測されませんので、採用すべきではありません。
ここまでは、心理学ではなく、データサイエンスの問題です。
アダム・グラントは、100%0、あるいは、100%1というまず観測されない分布を想定することを、バイナリ―バイアスと呼んでいます。
データサイエンスを習得すれば、回避する確率分布ですが、アダム・グラントは、データサイエンスを習得していないと、0か1かのバイナリーを選択する場合が多くなると説明しています。
これから、THINK AGAINは、データサイエンスを知らない人向けに書かれた解説であることがわかります。
デカルトの「我思う、故に我在り」も、バイナリーバイアスと思われます。通常はデータがなければ、あるか、ないかわからない状態のはずです。それを、無理やり、あるかないに分類するのは、バイナリーバイアスです。
こうかくと、反論する人もいるでしょうから、例をあげておきます。コンピュータのソフトウェアは、簡単な問題を考えることができます。この状態では、ソフトウェアは、存在していると思われます。しかし、ソフトウェアは、別のコンピュータに、コピーできます。つまり、情報(ソフトウェア)の実在とハードウェアの実在は、全く別の問題です。バイナリーバイアスによって、2つが混同され、おかしな結論が得られます。
訳者はあとがきで、「分ければわかる」という科学的な方法を、THINK AGAINは、主張していると言います。しかし、「分ければわかる」は、バイナリーバイアスであって、データサイエンスでは、否定されています。「分ければわかる」は科学的な方法ではありません。これは、地球温暖化仮説の妥当性の例題を見れば明らかです。
「分ければわかる」は、Heysらの第4のパラダイムで言えば、経験主義の第1のパラダイムに対応しています。
一方、バイナリーバイアスを避ける方法は、データサイエンスの方法で、第4のパラダイムに属します。
筆者は、Heysらの第4のパラダイムの受け売りですが、第4のパラダイムは、第1のパラダイムを書き換えてしまうと考えています。