表現は、データ取得に優先する(1)

1)魚釣りの話

 

魚釣りにいくには、釣り竿を準備します。

 

準備する釣り竿の種類によって、とれる魚が決まります。

 

あるいは、昆虫採集をするときに、網を準備します。

 

蝶を採る網では、セミをとることはできません。

釣り竿、網は、データサイエンスにおける表現に相当します。

 

表現が決まれば、取得できるデータがきまります。

 

録音機を持って行っても、写真は撮れません。

 

フィルムカメラをもっていっても、録音することはできません。

 

デジタルカメラを持っていけば、録音することができますが、これは、デジタルカメラには、マイクと録音装置がついているからです。

 

マイクと録音装置がついていないデジタルカメラでは、やはり、録音することはできません。

 

2)まず表現形式、次にデータ取得

 

パールは、「まず表現形式、次にデータ取得(Representation first、 acquisition second)というパラダイムがあるといいます。

 

このパラダイムの出典が、わからなかったので、Coplilot、Gemini、 Open AIに聞いてみました。

 

CoplilotとGeminiは、パールのオリジナル、 Open AIは、マイケル・トマセロのオリジナルという回答でした。トマセロは、社会認知の起源、特に、言語の起源の専門家です。トマセロの用法は、ニュアンスが異なるので、パールのオリジナルと思われます。

 

パールのパラダイムは、言語がなければ、「問う」ことができず、推論ができないという展開につながります。

 

データサイエンスは、データに基づく推論をしますので、データがなければ、推論ができません。データがあるためには、表現形式が前提になります。

 

例えば、パールは、言語がない例として、do演算子がない世界の説明をしています。

 

do演算子の例題から判断すると、(do演算子があるか、ないかというような)表現を調べれば、「問い」が、存在するか、「問い」が、存在しないかを調べることができます。

 

3)検証とデータセット

 

科学は、検証を伴います。

 

検証は、あるデータセットに対して行われます。

 

データセットを特定しなければ、検証はできません。

 

あるデータセットで、仮説が検証されても、別のデータセットで、仮説が検証される保証はありません。仮説には、データセットの選好性があります。

 

20世紀は、物理学の世紀でした。

 

物理学があまりに、大きな成功をおさめたので、多くの学問が物理学をモデルにしました。

 

物理学の仮説には、データセットの選好性がありません。

 

ニュートンは、月とリンゴの運動は、同じ運動方程式(力学法則)で記述できると主張しました。

 

これは、力学法則には、月とリンゴのデータセットの選好性がないという主張です。

 

データセットの選好性がないと、データセットを記録しておく必要がないので、メモリー節約になります。

 

だからといって、検証が、データセットに対して行われたことを忘れるべきではありません。

 

科学の仮説で、物理学のように、データセット選好性がない仮説は例外です。

 

人間の心臓は胸のほぼ中央、やや左寄りに位置します。

 

この仮説には、例外があります。まれに、心臓が体のやや右寄りに位置する人がいます。

 

心臓の手術をする前には、心臓の位置を確認しますので、例外が問題になることはありません。

 

病気を治療する場合には、薬を投与します。この場合にも、稀に、薬に対して、アレルギー反応を示す人がいます。

 

ワクチンを接種すると副反応で、亡くなる人もいます。この場合も、接種後、予想外の副反応をする場合を想定して、対応します。亡くなる人をゼロにはできませんが、副反応で、体調が悪くなった時点で、救急対応をすれば、死亡する確率を押さえることができます。

 

このように、医学の仮説は、患者というデータセットによって、成り立つ場合と成り立たない場合があります。

 

医学だけでなく、人間が関与する問題を対象とした学問では、データ選好性があり、仮説は、データセットと切り離しては、成り立ちません。

 

経済学者の中には、経済学の法則は、80%くらいしか成り立たないという人もいます。

 

しかし、筆者には、この表現には、物理学のメンタルモデルによる汚染があると感じられます。

 

医学の世界では、2重盲検薬試験をしても、薬の効果がある人の割合が70%程度の薬は多いです。

 

こうした薬の場合には、投薬をしながら、効果をみて、効果が認められない場合には、投与を中止します。

 

ところが、経済政策については、経済法則が外れる可能性があるにも関わらず、経済政策を継続します。さらに、経済政策の効果は、検証されることありません。

 

経済学の方法には、データセット選好性があるにもかかわらず、教科書に書いてある、有名なA教授がいったという、科学を無視した主張が繰り返されています。

 

アベノミクスは、その典型例です。

 

教科書に書いてある経済法則は、100%成り立ちません。経済学は、物理学のように、データ選好性のないレベルでの仮説の検証はなされていません。

 

20世紀の著名な経済学者は、データ選好性の問題の存在を理解していました。彼らが、データ選好性の問題を無視した理由は、データを記録する方法がなかったからです。

 

今世紀になって、ビッグデータを扱うことは容易になりました。

 

データ選好性の問題は、解決可能な問題になっています。



4)税制の課題

 

日経新聞は、次のように伝えています。

 

石破茂首相は2025年6月30日、日本経済新聞のインタビューで参院選後から社会保障制度改革の与野党協議を呼びかける考えを示した。制度の持続性を高めるため「改革と負担の両面から議論しないといけない」と述べ、税制や保険料、給付のあり方も議題にすべきだと強調しました。

<<

首相「社保改革は負担と両面で」参院選後から議論 単独インタビュー 2025/06/30 日本経済新聞

https://www.nikkei.com/article/DGXZQOUA303870Q5A630C2000000/

>>

 

この記事は、かなりおかしいです。

 

「税制や保険料、給付のあり方の議論」は、2025年に新規に生じた課題ではありません。

 

本来であれば、論点が整理されているはずです。

 

この例題に対して、表現を調べて、「問い」が、存在するか、「問い」が、存在しないかを判断します。

 

税制の検討について、Googleで検索すると次のようなWEBがヒットしました。

 

<<

「これからの税制を考える -経済社会の構造変化に臨んで-」平成9年1月24日

税制調査会

https://www.cao.go.jp/zei-cho/history/1996-2009/etc/1997/zeichob3.html

 

社会保障・税⼀体改⾰の概要(議論の経緯)

https://www.cas.go.jp/jp/seisaku/syakaihosyou/seihu_yotou/siryou2-2.pdf

 

社会保障の在り方に関する懇談会における議論の整理(案)

https://www.kantei.go.jp/jp/singi/syakaihosyou/dai9/9siryou1.pdf

>>

 

この検索結果は異常です。

 

税制の検討が進んでいるのであれば、検索した場合には、時間の新しいデータが上にくるはずです。

 

しかし、ヒットするデータの日付は、バラバラです。

 

これは、税制の検討が過去20年以上、全く進んでいないことを示しています。

 

税制には、所得移転効果があります。

 

所得移転効果を検討するためには、所得の分布データが必要になります。

 

また、所得の下位10から20%は、生活保護に該当します。

 

生活保護を検討するには、所得の分布の下位10%、下位20%といった数字が必要になります。

 

現在では、ベイズ統計学によって、任意の確率分布について、下位10%、下位20%といった数字を求めることができます。

 

年金の将来予測をする場合に、クリティカルな所得は、生活保護より若干所得の高い分布の人になります。年収分布は正規分布ではないので、平均値は、代表値ではありません。

 

こうした問題を、パール流にいえば、統計学の数的言語なしには、「問い」を立てることも、データを集めることも、推論することもできないといえます。

 

税制調査会の資料には、統計学の数的言語は出てきません。したがって、税制調査会は、何をすべきかという「問い」を立てることも、データを集めることも、推論することもできないはずです。

 

石破茂首相が2025年6月30日、日本経済新聞のインタビューで「改革と負担の両面から議論しないといけない」と述べたことは、税制調査会は、何をすべきかという「問い」を立てることも、データを集めることも、推論することもできないという事実に対応しています。

 

文系の学者は、数学や統計学の言語がなくとも、政策判断ができると主張します。

 

しかし、仮説には、データ選好性があります。データ選好性の問題は、ビッグデータとそれをハンドリングできる統計学の数的言語なしには、扱うことができません。

 

オーストラリアのPeter McDonald教授の少子化対策を紹介しました。

 

McDonald教授のレポートを理解するには、メンタルモデルの共有が不可欠です。

 

メンタルモデルの概要は、次の図でした。



 

税制問題も、似たようなメンタルモデルがないと検討できません。そして、メンタルモデルの各モジュールは、確率がわからないと理解できません。

 

パールは、「因果推論の科学」で、因果推論のための数的言語として、do演算子と因果ダイアグラムを取り上げています。

 

Figure 3は、因果ダイアグラムに、書き換えることが可能です。

 

税制調査会の資料には、因果ダイアグラムに転写可能な図は出てきていません。

 

つまり、そこには、メンタルモデルがありません。理解ができていないのです。

 

5)日米協議

 

日米協議に関する最近の報道には、次のようなものがあります。

 

赤沢氏は、6月30日に帰国。羽田空港で記者団に「回数を重ねるごとに理解が深まっている。精力的に、真摯(しんし)かつ誠実な協議を続ける」と述べた。

 

石破茂首相は2日、トランプ米大統領の関税交渉を巡る発言について「現在協議中であり、大統領の発言一つ一つにコメントしない」と述べた。

 

7月2日の日本記者クラブでの党首討論会で発言した。石破首相は、どうやって日本市場向けの自動車を作り、販売していくのかを「日本の安全を考えながら米国と議論する」と語った。

 

協議の内容は、非公開で、不明ですが、赤沢氏の「回数を重ねるごとに理解が深まっている」という発言にもかかわらず、石破首相の「日本の安全を考えながら米国と議論する」という発言のように、「問い」がないので、先に進んでいないように見えます。