サンプリングバイアスと人文科学(改訂版)

1)政党討論会

 

政党討論会が、日曜日のテレビとラジオで放送されています。

 

各党の議員が、発言して、討論します。

DXが議論の対象となる時には、ITベンダーの人も出席していました。

 

しかし、ここで、行なわれている議論は、少数の事例が、全体を代表するという間違った前提に、基づいています。

 

データサイエンスの基準では、サンプリングバイアスを無視すれば、間違った結論が導き出されます。

 

サンプル数を操作することで、結論を捏造する「pハッキング」は、最近になって、わかった論文捏造の手法です。

 

政党討論会では、エビデンスデータの母集団が議論されることはありません。

 

エビデンスデータを示す図表が示されることもほとんどありません。

 

これは、政治討論会の議論には、科学的な価値がないことを意味しています。

 

政党討論会は科学的には、時間とエネルギーの無駄です。



2)経団連の発言

 

それにしても、課題のキーワード、補助金をキーワードに合わせた業界に配布するだけが唯一の政策です。



政策の効果は計測されませんし、間違った政策は変更されません。

 

正確には、データが計測されませんので、まちがった政策か否かは不明ですが、改善すべき点のない完全な政策は通常はありませんので、全ての政策は間違い(改善すべき点)を含んだ政策のはずです

 

補助金は、業界に流れ、消費者には配布されません。

 

経団連の十倉雅和会長は2023年11月20日の記者会見で、岸田政権の支持率低下に歯止めがかからないことについて、「一つ一つの政策は正しい方向で、それぞれ評価している。なぜこれで支持率が上向かないのか私も不思議だ」と述べています。

 

経団連は、業界に補助金がくれば、政策効果のエビデンス計測は、どうでもよいといっています。

 

経団連の経営者には、生産性の向上よりも、補助金の獲得に関心がある人が多いように見えます。

 

欧米の経営者は、生産性の向上を目指していますので、これでは、差がついて当然です。

 

DXの差は、この事実の結果と推定されます。

 

生産性が上がらなければ、賃上げはできませんので、生産性の向上よりも、補助金の獲得に関心がある経営者は、社員の給与をあげることには、関心がないことになります。

 

政府が、インフレ以上に賃金をあげる(実質賃金の上昇)を要請しているのに対して、それは実現できないといっている経営者団体もあります。

 

賃金は、生産性が上がらなければ、上がりませんので、生産性を無視して、賃上げを要求する政府も、無理な要求をしていますが、できないと言っている経営者団体も、生産性の話はしませんので、同じレベルの議論になっています。

 

統計的にみれば、補助金は、生産性を押し下げる効果が高いと思われます。これは、補助金があれば、生産性が上がらなくとも、黒字を出せるからです。円安や非正規採用の拡大も補助金と同じ効果があります。DXを進めれば、その分、内部留保が減ります。XDが進まないで、大きな内部留保が積みあがる姿は、企業が、賃金をあげる努力をしない姿なので異常です。

 

欧米のように労働市場があれば、賃金が低い企業からは、有能な人が流出するので、経営者は、賃金をあげます。

 

2023年11月に、OpenAIのアルトマン氏が、マイクロソフトに移籍しました。

 

この記事に対するコメントの中に、日本では、退職するときに、競合企業には転職しないという誓約書を書かされるといっている人がいました。

 

これは、職業選択の自由を拘束するので、憲法違反です。

 

日本のSDGsや企業ガバナンスは、先進国レベルではなくなっています。

 

政府は、外交では、「法の支配に基づく 自由で開かれた国際秩序の維持」をうたっていますが、国内のSDGsを見ると法の支配は怪しくなっています。 

 

3)大阪・関西万博

 

スポーツ報知は、大阪・関西万博が、酒の席で決まったといいます。

 

 橋下氏は15年12月、松井氏、吉村氏とともに万博誘致の協力を仰ぐため、当時の安倍晋三首相(66)、菅義偉官房長官(71)と会談した席を回顧。「万博が実現したのは松井さんの政治力。安倍さんのおちょこに酒を注いで『(万博は)必要ですよね! 総理!』。安倍さんはお酒が強くないのに、安倍さんも『そうだよね!』。それまでは(世論は)シラ~ッとしていたが、お酒を注ぎ倒して実現した」と松井氏の酒宴での“腕”を評価した。当時、大阪市長に就任したばかりの吉村氏も「おちょこ事件」と表現して「あの事件以来、グワーッと動いた」と驚いたという。

 

大阪・関西万博に限らず、日本では、過去に、政治的な決定が、料亭(酒の席)で行なわれたという報道は、数多くあります。

 

政治的な決定が、料亭(酒の席)で行なわれるのは、当然であると考えている人もいます。

 

しかし、政治的な決定が、料亭で行なわれているとすれば、その決定は、政党討論会レベルのエビデンスデータに基づかない決定になっていると思われます。

 

政治的な決定が、エビデンスデータに基づいているのであれば、料亭では、意思決定はできません。

 

政治的な意思決定が、料亭でなされる場合、意思決定は、ほぼ100%利権を元に行なわれていると判断できます。

 

政治的な決定のデータには、利権の影響を受けているデータと利権の影響を受けていないデータがあります。

 

研究に有用なデータは、利権の影響を受けていないデータです。

 

データは、綿密なサンプリング計画に基づいて収集されるべきです。

 

しかし、政治家の行動が、利権を中止に動いている場合、利権の影響を受けていないデータの取集は、絶望的です。

 

自然科学は、価値を取り扱いませんが、自然科学が、人間生活に負の影響を与えることがあります。

 

核兵器は、人類の安全に大きな影響を与えています。

 

生成AIの安全性を問題にする人もいます。

 

自然科学は、価値を取り扱いませんが、自然科学者には、人類の幸福に寄与する研究をする、あるいは、人類の幸福に反する研究をしないという倫理が必要であるという主張もあります。

 

倫理の必要性に反対する人はいないと思いますが、有効で合理的な倫理の実装の可能性については、自然科学者の間でも議論があります。

 

政治に関連する人文科学があります。

 

人文科学では、倫理のような価値も取り扱えると考えられています。

 

人文科学の研究では、核兵器のような大きなエネルギーを生み出す研究はできないので、人文科学の研究の倫理規定が問題になることはありません。

 

政治に関連する人文科学が、帰納法を使って研究する場合には、日本の過去の料亭政治(利権)の研究になります。

 

得られる過去の政治決定のデータが、利権を元に行なわれている場合、これは、不可避です。

 

政治に関連する人文科学が、自然科学と同じように、人類の幸福に寄与する研究をするという倫理規定を持っているのであれば、、帰納法に基づく料亭政治(利権)の研究はすべきではありません。

 

この倫理規定を守らず、帰納法に基づく料亭政治(利権)の研究をすれば、政治に関連する人文科学は、利権を強化する研究になってしまいます。

 

このように、帰納法に基づく政治の研究には、手法上の致命的な欠陥があります。

 

マスコミに登場する政治の評論家は、過去の料亭政治(利権)の専門家であって、国民を幸福にする政治についてのノウハウはゼロになります。

 

4)マーケット調査

 

あるメーカーが新商品の開発のために、サンプルを配布して、アンケートをとった場合を考えます。

 

ここでは、新しいカレールーをつくって、ショッピングセンターで、実際に、カレーを一口、試食してもらい、アンケートに答えてもらったら、カレールーを返礼にする場合を考えます。

 

このカレールーは既に、ブランド化されていますが、アンケートの結果を踏まえて、スパイスの配合を見なおす計画です。

 

カレールーには、子供のいる家族向けの甘口のブランドと独身者向けの辛口のブランドがあります。

 

スパイスの配合を見直す際には、ブランドイメージを壊さないように注意します。

 

アンケートの結果を単純に集計するのではなく、ブランドイメージにあった年齢層の回答を中心に、分析しているはずです。

 

全てのサンプリングには、ある目的を基準にすれば、バイアスがあります。

 

データは、バイアスを補正して使う必要があります。

 

5)年代別投票率

 

図1にみる衆議院選挙の投票率は、平成に入って低下しています。

 

特に、20代の投票率の低下が著しいです。

 

選挙は、国民の政治に対する意思を、投票というサンプリングによって収集する手段です。

 

国民の政治に対する意思を、年代別に階層化して考えれば、年代別投票率が違うということは、サンプリングバイアスがあることを意味します。

 

国民の政治に対する意思を正確に把握するには、サンプリングバイアスは、補正すべきです。

 

補正を年代別階層で行なうには、投票に、年代別投票率の逆数をかければよいことになります。

 

令和3年の20代の投票率は、36.5%、60代の投票率は、71.43%でしたので、各々の年代階層の得票数に、1/0.365と1/0.7143をかければ、補正できます。

 

年代別投票率は、投票が終るまでわかりませんが、電子投票であれば、リアルタイムで、年代別投票率を計算することは容易です。

 

補正に用いる投票率は、選挙区単位で計算するとよいでしょう。

 

国民の政治に対する意思を、投票というサンプリングによって収集する場合には、サンプリングバイアスを補正すべきです。

 

一票の格差」は、裁判所の判決文や総務省発表資料等では「投票価値の較差」「投票価値の不平等」とも表現されています。

 

これも、サンプリングバイアスです。

 

サンプリングバイアスの補正法は、データサイエンスで研究されています。

 

電子投票であれば、「一票の格差」の補正は容易です。

 

ウィキペディアには、次のように書かれています。

一票の格差」における本質は、議会の裁量が選挙制度における一般的な合理性を有するものとは到底考えられない程度に達しているときや限界を超えている場合の、議会の権限と責任において解決すべき問題に対する不作為を指摘し、有権者への権利侵害を問題視するものである。

 

しかし、サンプルバイアスの補正は、データサイエンスでは、一番最初に行なう処理です。

 

これが、間違った論文やレポートは受理されません。

 

サンプリングバイアスの補正が理解できていないと、データサイエンス関連の科目の単位は取れず、大学は卒業できません。

 

衆議院参議院選一票の格差について、最高裁が、憲法判断の判決を繰り返しています。

 

 一票の格差は投票後でも、簡単に補正できます。

 

ウィキペディアに、書かれているような頭のいたくなるような基準を議論するよりも、サンプリングバイアスを補正する方がずっと簡単です。

 

一票の格差」を検討する裁判官は、サンプリングバイアスが理解できていないように見えます。

 

最高裁の判決と同じ内容を卒業論文に書けば、データサイエンス学科の学生は、卒業できません。

 

データサイエンティストは、 「一票の格差についての最高裁憲法判断の判決」を権威の方法としては理解していますが、科学の方法としてはあり得ないと考えているはずです。

 

最高裁判所は、権威の方法で、判決を出すことができますが、その判決が科学の方法に従っていない場合には、科学者からの支持をえることはできません。

 

これは、生成AIの安全性や、生命倫理に対する判決の科学としての信頼性に疑義を生むことになります。

 

科学技術基本法が改正されて、人文科学は、独自の科学であると追記されています。

 

これは、人文科学の判断は、自然科学の影響をうけないという主張です。

 

人文科学者は、自然科学が好きではないように見えます。

 図1 衆議院選挙の年別投票率



6)どうすればよいか

 

国民を幸福にする政治は、今までの帰納法フレームワークでは不可能です。

 

サンプリングバイアスは補正する必要があります。

 

データサイエンスが理解出来ている人は、代替案を理解していると思います。



引用文献



2025年大阪・関西万博に橋下徹氏「松井さんが安倍さんにお酒を注ぎ倒して実現した」 2020/11/20 スポーツ報知

https://hochi.news/articles/20201129-OHT1T50155.html?page=1

 

国政選挙における年代別投票率について

https://www.soumu.go.jp/senkyo/senkyo_s/news/sonota/nendaibetu/