リベラルアーツが有害である証明（９）

１６）成分分離と級数展開

エンジニアリングの基本の数値化とその処理を論じます。

数値化（コード化）：

エンジニアは、数式（アルゴリズム、理論科学）、数字（コード化、計算科学、生命科学）、データ（データサイエンス）を問題にします。

今世紀にはいって、データサイエンスが確立しました。

データサイエンスは、全てのデータは、数字（コードを含む）で表現でき、コンピュータで処理できることを前提としています。

リベラルアーツのミームの人は、何でも数字にすることはけしからんという人もいますが、それは、ナンセンスです。

歴史をみれば、人類が、数字を扱うようになってから、まだたいして時間がたっていません。

数字のない文化もあります。

数字のない場合には、オブジェクトの属性値は、おおむね３から５段階です。

アンケートをする場合に、（普通、良い、悪い、とても良い、とても悪い）から選択する場合には、属性値は5段階です。

数字にしなければ、これより細かな属性分けは困難です。

2種類の属性（良い、悪い）は、1ビット（２の1乗）です。

2ビットで4種類、3ビットで、8種類の属性になります。

数値化しないで人間が扱える情報量は、3ビット未満と思われます。

つまり、エンジニアのミームでみれば、「何でも数字にすることはけしからん」という主張は、「情報量は、3ビット未満で十分」といっていることになります。

エンジニアは、ビット計算ができない人と議論するつもりはないので、この問題の話し合いは行なわれません。

成分分離：

数値化ができれば、次のステップは、成分分離になります。

ボールの運動は、運動方程式で記載できます。

運動方程式の主要部分は、ニュートンの法則ですが、ボールが減速して停止する現象をモデル化するためには、摩擦項を追加します。

摩擦項の大きさは、データに合わせて、係数を調整します。

表面がつるつるのボールと表面がざらざらのボールでは、摩擦の大きさが違いますので、実測されたボールの減速データに合うように係数の大きさをきめます。

この係数が決められる前提には、データが数値化されていることがあります。

データが数値化されていない場合や、数値化されても、データ量が3ビット未満で精度が不十分な場合には、係数を決めることができません。

摩擦項の係数が決まれば、ボールの運動は、慣性項と摩擦項に成分分離ができます。

成分分離とは、因果モデルでいえば、複数の原因がある場合に、原因の分離ができたことに対応します。

各要因の大きさは、条件により異なりますが、条件を与えれば、モデルで計算できます。

数値化されていない場合には、成分分離に進むことはできません。

級数展開：

級数展開は成分分離の特殊な場合です。

次のようなイメージになります。

現象のモデル　＝　成分１　＋　成分２　＋　成分３　＋　..　.+　残差項

ここで、成分は、級数展開で、自動的に分離されます。

級数展開のポイントは、次の条件にあります。

成分１　＞＞　成分２　＞＞　成分３　＞＞..

「＞＞」は、スケールの違いを示します。

「＞＞」の定義はありませんが、イメージとしては10倍以上違う対数の世界を考えれば十分です。

級数展開では、級数の定義式では、項を沢山並べますが、次の近似ステップで、頭の２，３項以外は、無視できるとして切り捨てます。

級数展開の典型的なテーラー級数では、第1項は、定数項、第2項は、線形項で、第3項以降は省略されることが多いです。

級数の項の数は、実際のデ―タを再現する精度で点検されます。

時間微分の微分方程式では、時間刻みが小さい場合には、線形項でも十分な精度が得られることが多いです。

級数展開のポイントは、成分を自動的に分解できること、影響の小さな成分は無視できることでした。

影響の小さな成分は無視できることは、級数展開しない成分分離にもあてはまります。

影響の小さな成分の省略は、エンジニアリングの基本です。

最近、メタは、AI開発に1兆円以上を投資すると発表しました。

政府は、AIの技術開発に数百億円の補助をする計画です、

政府の開発費補助は、メタの100分の１のオーダーです。

これから、政府の補助の研究成果からは、メタと競争力のある研究成果がでないことがわかります。

メタはＡＩのソースコードを公開しています。

今後もメタは、ＡＩのソースコードの一部を公開するでしょう。

ＡＩの研究者は、政府の補助金をもらうよりも、メタのＡＩのソースコードを利用した方が成果が上がるはずです。

メタのＡＩのソースコードを活用して、成果があがれば、GAFAMに転職するチャンスもうまれるはずです。

法度制度のミームで、エンジニアが、政府の言うことを聞いて、AIの補助をもらって、奴隷のように働くと考えることは、労働市場を無視した中抜き経済の発想です。

高度人材は、労働市場をみて移動しますので、政府の補助金をもらう労働市場のない企業には、高度人材は集まらないはずです。

議論の集約：

ここまでの検討をまとめておきます。

データの属性を数値化すれば、成分を分離して、影響の小さな成分は無視できるというステップに進むことができます。

成分の分離は、原因の分解に対応します。

影響の小さな成分の無視は、原因の選別に相当します。

原因が絞り込めれば、問題解決の対策を絞り込むことができます。

これが、エンジニアリングの標準的な手順です。

少子化問題に、エンジニアリングの標準的な手順が適用されていた場合を考えます。

データの属性を数値化すれば、成分を分離して、影響の小さな成分は無視できるというステップに進んでいるはずです。

つまり、少子化対策には、第1に、何をすれば、効果がいくらあるか、第2に、何をすれば、効果がいくらあるかが、わかっているはずです。

これがデータサイエンスの効果です。

現実には、少子化の専門家は、少子化対策になるかも知れない提案をしているだけです。

少子化の専門家は、少子化のデータを集めて、帰納法で、現状がどうなっているかを良くしてっています。しかし、現状がわかることと、問題解決（解決策のデザイン）ができることは、全く別の問題です。

筆者は建築の素人ですが、歴史的建造物を訪問して、帰納法で、歴史的建造物の特徴を要約したレポートをつくることができます。しかし、筆者は、歴史的建造物を設計できる訳ではありません。

少子化の専門家は、リベラルアーツで活動しており、数値化には懐疑的です。

つまり、3ビット未満のデータを処理していることになります。

もとのデータの精度が、不十分な場合には、成分分離はできません。

つまり、原因の特定はできません。

これは、単純な数学の問題です。

少子化問題を、リベラルアーツではなく、エンジニアリング（データサイエンス）で取り扱っていた場合には、少子化問題の解決の手順は全く異なっていたことがわかります。

こども家庭庁は、少子化の因果モデルの原因とは直接の関係がありません。

エンジニアリング（科学の方法）で考えれば、こども家庭庁ができても、少子化問題が解決できると考える理由はありません。

こども家庭庁ができれば、その分だけ、経費が増え、税負担が増加します。

こども家庭庁ができて、税負担が増加した結果、少子化が促進される可能性もあります。

これは、仮説にすぎませんが、因果モデルでは、このように、可能性のある原因をリストアップして、成分分離と影響力の評価を行ないます。

ここでは、少子化を例に上げましたが、リベラルアーツとエンジニアリングという2つのアプローチが可能な全ての問題には、同様の構造問題があります。

リベラルアーツが役に立つと主張する場合には、このような現実をふまえるべきです。