オリンピックとデータサイエンス

オリンピックが終わりました。

バッハ氏のように、逃げ切りモードで早々に評価する人もいますが、2021/08/08のThe Answerに、「シカゴ・トリビューン」のスポーツ記者、ステイシー・セントクレアさんが次のようにいっています。「パラリンピックが閉幕して数週後、日本の感染状況がどうなっているかを見てからでなければ、東京オリンピックの本当の評価は決まらないでしょう。閉幕後に日本で感染爆発が起こらないことを祈るばかりですが、万が一そうなってしまった場合、IOCが取るべき責任は大きいと思います」

評価には、時間がかかります。

今回は、メダルとデータサイエンスの関係をまとめてみます。

 

コロナウイルスの感染で問題になるのは、7日平均感染者数と感染者数の増加率です。毎日の感染者数は、データのばらつきを拾っているので、意味はありません。

オリンピックも同じで、例えば、体操で、難しい技を成功させる確率が66%の選手が、最終競技をした場合に、3回に2回は、金メダルが取れますが、1回はメダルを取り損ねます。これは、データのばらつきで、本人の努力とは直接は、関係ありません。オリンピック選手では、試合に勝てないのは自分が悪いと考える人もいますが、そう考えると精神障害を負ってしまいます。

例えば、1964年の東京オリンピックでは、 マラソン円谷幸吉選手は、2位で国立競技場に戻ってきますが、イギリスのヒートリーに抜かれ惜しくも3位になります。その後、1968年のメキシコオリンピックを目指しますが、1968年の1月、両刃のカミソリで頸動脈を切って自殺してしまいます。

円谷選手は、3位だったわけですが、データサイエンスで見れば、この時の2位のヒートリーとの差は、ばらつきの範囲内であったと思われます。つまり、メダルの色は、データサイエンスでは、ノイズの塊なので、そのままでは、処理できないクリーニングが必要なデータにすぎません。

ラソンは1回勝負ですが、予選を勝ち抜く競技もあります。この場合には、リーグ方式の方が、トーナメント方式より、ばらつきが小さくなります。

1964年の東京オリンピックの金メダル数は163個でした、今回は、340個ありますから、2倍くらいあります。つまり、データサイエンスでみれば、今回の金メダルは、前回の東京オリンピックの金+銀メダルの水準です。これは、競技人口を無視した概算ですが、競技人口が少なくなれば、ばらつきの影響は大きくなります。競技人口の少ない新しい競技で、若年者が活躍するのは、ばらつきが大きいので、納得できる現象です。つまり、金メダルの価値は、競技人口に反比例するはずです。また、男女共同競技を増やしましたが、競技数を増やすと、1回の競技に対するリソース配分が減るはずです。少なくとも、集中力は落ちます。これは、男女共同マラソンができないことを見れば、明らかです。さらに、陸上では、特定のメーカーの靴を購入できないと記録がでないこともわかっています。

このように、オリンピックのメダルシステムは、データサイエンスで見れば、突っ込みどころ満載で、きわめて不合理なものです。これが、気にならないようであれば、データサイエンティストには向いていません。

また、オリンピックの総メダル数を気にしている国は、5から10か国程度で、世界的に見れば、マイナーです。もちろん、ブラジルのサッカーのように、国によっては、こだわりのある競技がありますので、そこでのメダルは、その国で話題になると思われますが、メダル総数を気にしてはいません。これは、メダル数は、競技人口と投入金額の関数であって、個人の努力の寄与分が少ないことがわかっているからです。

ブラジルのように、オランダでも、冬季オリンピックのスケートは重視されています。一方、オランダは、人口が少ないので、産業構成も、選択と集中を行っており、自動車産業はありません。メダル数が、競技人口と投入金額の関数である場合には、財力に応じた目的を設定する必要があります。

日本では、労働人口の10%以上が、自動車関連産業で働いていますが、今後EV化に伴って、労働者のシェアの縮小が起こるでしょう。その時には、選択と集中が必須になります。10年前までは、自動車産業が、設備投資規模が最大の産業で、規模の経済が働く産業でした。現在では、規模の経済が働く分野は、ICであれば、TSMCの一人勝ちで、新設工場に1兆円以上をかけます。AIであれば、GAFAが、毎年1兆円の研究投資をつぎ込んでいます。このように、10年の間であれば、トヨタを中心に、日本は、投資額がものをいう規模の経済の中にいたのですが、現在は、競争から、落ちこぼれてしまいました。政府のバラマキによる産業振興政策は、規模が小さすぎて無効です。このように、日本の現状は、競技人口と投入金額の関数であるメダル総数競争からは、降りるべきなのです。

競技前には、メダル個数は、前回の夏のオリンピックのように、米国が中国を離して1位になると予想されていましたが、結果は、米国の1位は、揺るがなかったものの、その差は小さくなっていました。これは、米国と中国の経済力の差の変化を反映しています。

オリンピックのメダルは、データサイエンスからすれば、ノイズが多すぎて、評価する気にもなれませんが、5年後の今回のオンピックの歴史的評価が、2021年はどんな年かを明らかにするでしょう。

  • 17日間取材した米記者が思う東京五輪のレガシー「感染動向をIOCが責任持ち見守るべき」 2021/08/08 The Answer

https://news.yahoo.co.jp/articles/24e8d05aedfcb796d0d9e107ee10261d96a4e65a

  • バッハ氏「五輪開催正しかった」 閉幕に合わせ 2021/08/08 共同

https://news.yahoo.co.jp/pickup/6401067

 

 

前の記事

8月第1週の東京都の感染者数のまとめ~コロナウイルスのデータサイエンス(231) 2021/08/08

 次の記事

沖縄県と神奈川県の近況~コロナウイルスのデータサイエンス(232) 2021/08/10