1)棲息域系モデル
生態系のモデルの一つに生息域モデルがあります。
ここでは、仮に、A種の魚の棲息域を問題にします。
魚の生息域評価は大きく3つのステージに分かれます。
(S1)成魚が棲息可能な条件
(S2)成魚が産卵し、卵がふ化可能な条件
(S3)稚魚が棲息して成長可能な条件
各ステージについて、次の条件が必要になります。
(T1)棲息に耐えられれる水質、低質、溶存酸素、流速、水深、水温などの条件
(T2)棲息に必要なエネルギーが得られる餌が確保できる条件
(T3)棲息に必要な巣あるいは危険から身を守れる条件
これらの条件は、通常、水質のように下限と上限の間として設定されます。
T3は、石の隙間、河畔植物の影などをさします。
生息域を、Casual Universeと考えれば、魚が棲息可能であることは、まず、第1に、A種の生息域のCasual Universeにいる魚を対象にして、モデルを検討すれば、問題をより簡単に整理できます。
Casual Universeを使わないと、例えば、次のようになります。
IF (水質=Z1 AND 低質=Z2 AND 溶存酸素=Z3 AND ... ) THEN (結果)
これは、気が遠くなるほど、複雑なモデルです。
2)原因とRCT
今、A種の魚が、Casual Universeにいることを前提にします。
次に、餌の量が変わった場合に、成長量が変化するというモデルを考えます。
モデルは、次の形をしています。
IF (餌の量)THEN (成長量)
ここで、餌の量が増えれば、成長量は増えると思われます。
これは、エネルギー収支の一般的な知見に合致します。
そこで、餌の量が、(大、中、小)の3つのインスタンス(餌(大)、餌(中)、餌(小))を実装してみます。
これに対応する3つの成長量(成長量(大)、成長量(中)、成長量(小))が、計測されます。
成長量(大)は、餌(大)に対応した成長量のことで、成長量が大きい意味ではありません。
ここで、X=(餌(大)、餌(中)、餌(小))、Y=(成長量(大)、成長量(中)、成長量(小))をプロットして、点が、右上がりになれば、「餌の量は増えれば、成長量が増える」というエビデンスが得られることになります。
ただし、その前提としては、餌の量以外値の変動量は、成長量に影響しないことが必要です。
例えば、餌(大)の時の水温が低く、餌(小)の時の水温が高ければ、代謝速度が変化した影響が出てしまいます。
この問題を回避できる唯一の方法が、RCTになります。
ある県では、「アサリの収穫量の減少の理由は海がきれいになりすぎたからである」とい仮説を検証する計画があるようです。
このように、水産物がとれなくなったときに、1つだけの原因を想定して、なおかつRCTの条件を満たさなない調査が繰り返されています。
この調査はデータサイエンスを無視していますので、意味のある結果は得られません。
仮説をたてるときに、Casual Universeを無視すると、このような無理が発生します。
3)テンソルモデル
「(T1)棲息に耐えられれる水質、低質、溶存酸素、流速、水深、水温などの条件」はベクトルです。
上限値の下限値もベクトルです。
(T1、T2、T3)と(S1、S2、S3)もベクトルです。これから、A種の魚のCasual Universeは、テンソルであることがわかります。
2023年時点のデータサイエンスの中心は、ベクトルです。テンソルの縮約のモデルは、10年くらい前から出てきました。なので、最近では、テンソルを使ったデータサイエンスもありますが、まだ、部分的です。
Casual Universeで考えると、生態系の変数は、テンソルであることがわかります。
これが、筆者が、生態学はデータサイエンスであると主張する理由の一つです。
生態系の問題を解決するためには、ビッグデータを整備して、そのデータを処理するテンソルの数学を展開する必要があります。
これは、現在、欧米の生態学の研究で起こっている現象です。