データサイエンティストは、全ての問題は、情報(多次元空間の点)に分解できるという信念をもっています。
データサイエンスの問題の多くは、評価関数の値を最大化(あるいは最少化)する解を求めることです。
この場合の評価関数の値は、スカラーである場合が多いですが、ベクトルでも、マトリックスでも、テンソルでも構いません。
次元があがると、人間の感覚がついていけなくなるため、利便性が下がります。
また、解空間に制約を設定することもあります。
評価関数の値を最大化する方法には、いろいろなバリエーションがあります。
数学的に解が求まることが、評価関数を使う場合に、一番重要な点です。
データサイエンティストは、政治思想や経営哲学のブリーフの固定化問題を2つのレイヤーに分けて考えます。
第1は、数学のレイヤーです。
第2は、イデオロギー(ブリーフの仮説検証)のレイヤーです。
プロトコルの優劣の問題を論じる前に、数学的な解の存在証明が必要です。
しかし、物理学は、永久機関の存在を否定しています。
しかし、プロトコルの解の数学の存在証明をスキップすることには、永久機関を開発するような無駄な作業をするリスクがあり、このステップをスキップすることは、望ましくありません。
データサイエンティスト(テクノリバタリアン)は、「数学は、イデオロギーより優先する」と考えます。
「テクノリバタリアン」に対する反論の多くは、「イデオロギーより優先する」ものがあるという事実に対する反感からきています。
イデオロギーは、基本的には、自由を目指します。
イデオロギーより優先するものがあることは、自由を束縛されているように感じられます。
統計学では、変数の分布を問題にします。
次の課題を考えます。
「サイコロの目の1から6の数字から、1つの数字を自由に選んで下さい」
被験者は、自分の自由意思で、自由に数字を選んでいると感じています。
しかし、自由に選んだ数字は、統計学の分布になります。
その分布をみれば、被験者の選択傾向が、分布形状として評価できます。
この統計分布があれば、被験者が次にどの数字を選ぶかを確率的に予測できます。
被験者が、被験者の行動を事前に予測されることは、自由の束縛であると感じても、それから逃れる方法はありません。
まったく、ランダムに数字を選んでも、それは、一様乱数や正規乱数のように分布形の1つとして固定化されてしまいます。
統計学の基本には、数学は自由意思(イデオロギー)より優先するという事実があります。
一方、自由を数学(統計学)で、定義することは容易ではありません。
ある人が、Aという行動をとったという記録があっても、その行動が自由意思に基づくのか、強制されたものであるのかを、データから判定することは難しいです。
これは、自由が、ヒュームのいう反事実を含んだ概念である可能性を示唆しています。