感染第2波の可能性~コロナウィルスのデータサイエンス(68)

全般の傾向

第2波はおこっていないですが、感染者数の減少傾向が止まってしまったので、今後の感染者数の変化に注意する必要があります。

googleデータの更新が29日でとまっていますが、Appleデータ(図1,3,4)をみると、最近1週間の行動制限は行動制限が弱まっています。その前のGoogleデータでは行動制限があまり弱まっていないので、最近の状態が不安になります。

今まで、感染者数の減少傾向が明らかであった神奈川県の感染者数の減少がとまってしまい、東京都、神奈川県、北海道ともに感染者の減少傾向がなくなりました。移動制限のデータは、制限がよりゆるくなっているので、感染者数は、今後は、増減しないか、増加すると思われます。

グラフの説明はまとめて後につけてあります。

 

東京都

感染者数の減少は止まっています。変化がなだらかな理由は、サンプルが多いためとおもいます。

感染者数が今後もゆっくり増加すると思われます。

 

図の凡例

ma7person:感染者数の移動平均

ma7unkonown:経路不明感染者数の移動平均

ma7transit: Google Transit移動平均(東京都)

ma7ap-tr: Apple Transit(東京)

 

f:id:computer_philosopher:20200602124729p:plain

図1 東京都の感染者数の推移

神奈川県

感染者数の減少が止まってしまいました。行動制限も聞いているので、感染者数はこのレベルで進むとおもいます。

 

図の凡例

ma7person:感染者数の移動平均

ma7transit: Google Transit移動平均(神奈川県)

 

 

f:id:computer_philosopher:20200602124801p:plain

図2 神奈川県の感染者数の推移

 

 

北海道

行動制限率が他より小さいので、とくに、今後の感染者数の変動に注意が必要です。

 

図の凡例

ma7person:感染者数の移動平均

ma7transit: Google Transit移動平均(北海道)

ma7sa-tr: Apple Transit(札幌)

 

f:id:computer_philosopher:20200602124832p:plain

図3 北海道の感染者数の推移

北九州市

感染者のデータ書式がまた変わりました。

経路不明感染者数は増え増えていなので、感染者の増加リスクは低いです。

感染者ゼロの期間に、発熱等の症状があった人が10人弱いたようですが、これの分は、経路がわかっている感染者なので、グラフの解釈には影響しません。

図の凡例

person:感染者数

ma-person:感染者数の移動平均

ma-g-transit: Google Transit移動平均(福岡県)

ma-a-fukuoka: Apple Transit(福岡)

f:id:computer_philosopher:20200602124907p:plain

図4 北九州の感染者数の推移

 

グラフの読み方

グラフで扱っているデータは次の2系統です。

  • 感染者数関連データ(左軸:単位:人)

  • 行動制限関連データ(右軸:単位:%)

グラフによって、扱っているデータが少し違います。以下では、種類が最大の場合について説明します。

1.感染者数関連データ

 感染者数のデータは、自治体がデジタルで公表している場合には、その値を使います。

 北海道、東京、横浜はこれに合致します。ただし、東京都のように過去にさかのぼってデータを修正した場合には、それに対応できていない可能性があります。自治体で、公表していないデータは出典により微妙に異なりますが、その場合には、出典を示しています。

 最新のデータは、ニュースから直接入力しています。

 経路不明者感染者数のデータは、一般には、自治体の公開デジタルデータに入っていません。ですので、基本は、感染者数で代表しています。

 経路不明感染者数のデータをとり使っているケースは次の2つです。

  • 東京都:これはニュースのデータを筆者が入力したものです。発表時の区分なので、その後、経路が判明した分は含まれません。

  • 北九州市:5月23日以降の感染者の個別データには経路が書かれていますので、これをつかって、23日以降の経路不明数を出しています。同様の方法が、他の自治体でも可能かもしれませんが、全て手作業になるので、ここ以外では難しいです。

2.行動制限関連データ

 スマホのMobile Reportのデータです。国内では、NTTとSOFTBANKのデータが、ニュースや厚生労働省のサイトで示されていましたが、デジタルデータでないこと、期間と測定点に一貫性がないことから、使い物になりません。ここでは、GoogleAppleの公開データを使っています。評価項目はGoogleでは6項目、Appleでは3項目です。測定期間は2月からの日データです。測定位置は、Googleは国、県単位、Appleは、国、地域、都市単位です。Googleはすべての側点で6項目がそろっています。Appleは、側点によって項目が異なります。また、国以下のレベルでは、地域区分は国をカバーしていません。都市は一部だけです。例えば、神奈川県については、神奈川県のデータは、Drivingの一項目だけで、Transitはありません。また、水戸はありますが、横浜はありません。ですから、使いやすいのはGoogleデータですが、公開日が遅れる難点があります。

これらのデータのうち、感染者数との関係が一番強いのは、Transitデータなので、ここでは、Transitデータだけを使っています。

なお、Appleのデータは、5月11、12日は欠測であるとされて、データは空白になっています。ここでは、11日のデータは10日の値を、12日のデータは13日の値で補填しています。

一部のデータは、11,12日ではなく、10,11日が欠測になっています。たとえば、東京の欠測は、11,12日ですが、福岡は10,11日になっています。この場合には、日付がずれている可能性もありますが、ここでは、日付は正しいとして、この場合には、10日に9日の値を、11日に12日の値を補填しています。

3.データ処理

 感染者数、経路不明感染者数、Google Transitデータ、Apple Transitデータは7日移動平均をかけて使っています。グラフの凡例に「ma」「ma7」などがついている場合は、移動平均であることを示しています。統計学移動平均は、平均期間の中央の日付のデータとして処理することが一般的です。しかし、非常事態宣言の解除の判断では直近1週間の平均値が問題になりました。これは、移動平均を最新の日付で処理することに相当します。このため、ここでは、移動平均期間の最新の日付のデータとして処理しています。これは、時系列解析の処理としてはアブノーマルで気持ちが悪いです。

移動平均以外に、参考に、感染者数の生データをプロットすることがあります。この場合には、凡例に「ma」を付けない、データを線で結ばないようにしています。逆に言えば、線で結ばれたデータは移動平均データです。

Google Transitデータ、Apple Transitデータはその効果が感染者数に現れるのに2週間程度の時間遅れが生ずるといわれています。そこで、これらのデータの日付は14日後にしています。例えば、6月1日のデータは、6月15日にプロットします。こうすることで、Transitからみた、感染者数の動きを予測しやすくなります。

感染してから、明確な症状が出るまでの時間遅れは2週間程度といわれています。この日付は、感染公開日ではなく、感染日です。しかし、推定感染日毎の感染者数データは公開されていません。これは、感染予測モデルを動かすためには、必須のデータなので、厚生労働省はこのデータを作成しているはずです。しかし、このデータは非公開です。単純に2週間ずらす、公開日毎の感染者数データを使うことには問題がありますが、今のところ良い代替手段はありません。

4.今までに、わかっていること

 都道府県単位では感染者数のデータとGoogle Transitのデータには、対応が見られます。4月の感染者の減少フェーズでは、Google Transitデータが-30からー40%の間で、感染者数の減少が見られました。

政府は、行動制限ー80%を目標ということで、NTTデータの行動制限データを効果して、外出の抑制を呼び掛けていました。このデータと、Google Transitデータ、Apple Transitデータを比較すると、NTTデータは、Google Transitとは20%くらい、Apple Transitとは40%くらい、差があります。NTTが-80%のとき、Googleはー60%、Appleは、-40%といった感じです。NTTは都市部の交通量の特に大きなところに偏っているので、数字が大きく出ているとおもいます。いずれにして、-80%が感染者減少には望ましく、-60%で増減なしというシミュレーションの値はデータからは現実にあっていないと判断されます。

北九州市のデータをみると、Google Transitデータは、感染者数よりも、経路不明感染者数に関連が深いです。これは、Transitデータが、移動制限に強く関連し、経路不明換算者数と対応していることを示唆しています。一方、Google Transitデータは院内感染などのクラスターの拡大との関連は薄いです。ただし、これは、北九州市では感染者数と経路不明感染者数が独立した変動を示したので、分析できたのであって、東京都のように、感染者数と経路不明感染者数の間の相関が高い場合には、その効果は分離できません。

北海道の最初の非常事態宣言の時点のデータを見ると、Google Transitはー40%に達していません。それでも、感染者が減少したので、クラスターつぶし対策が有効であったことがわかります。逆に、東京都の非常事態宣言のデータをここでは、Google Transitと結びつけていますが、これは、クラスターつぶし対策のデータが与えれれていないためです。

Google Mobile Report

https://www.google.com/covid19/mobility/ Accessed: <2020.05.31>.

Apple Mobile Report

https://www.apple.com/covid19/mobility 5-31version Accessed<2020.06.01>.