東京都のデータ集計の実態~コロナウィルスのデータサイエンス(115)

東京都のデータ集計の実態

予想に反して、PCR検査のデータは、今回は7月27日の次が28日と連日で更新されました。陽性率は若干高めでしたが、著しく高くはなっていませんでした。

こうした読み違いが発生する要因の1つが、検査データに過去にさかのぼっての修正であると申し上げています。

今回は、実例を示します。

表1に毎日の陽性者数(Po)と陰性者数(Ng)を示します。28日発表のデータをnewとし、27日発表のデータをoldとしてあります。差をdiffで示しています。差の合計(sum)も示しました。データは7月11日からです。10日以前は確認していません。検査にはPCRと抗体検査がありますが、ここでは数の多いPCRを示しています。

7月28日の時点で、一番古いデータの修正は7月13日分です。diff1とdiff2のsumを見ると検査数は899件(=53+846)増加しています。

この表をみると28日の感染差数が250人を越えて騒ぐことはナンセンスなことがわかります。

基本は7日移動平均でないと訳がわかりません。

7月13日は7月28日の15日前なので、この時点のデータが修正されることは、まともな情報システムではありえません。例えば、検査をした時点でIDが付与されるシステムであれば、データは、陽性、陰性、判定中の3つの属性値を持つはずです。しかし、このデータには、判定中はなく、突然過去の陽性または、陰性のデータが修正されます。修正が、どこまでさかのぼるかわかりません。

まともなシステムはいくらでものあるので、瀧本哲史氏の「6月30日」の本にあるサイボウスがヒットした理由が関係しているかもしれません。ファックスよりましなシステムはいくらでもあるのですが、現場の担当者が使いこなせないので、利用講習や質問に忙殺されることを嫌って、IT部門の担当者は手を付けないという説明です。特に、公務員の場合に手当も増えないことが多いので、やっていられなくなります。(注1

 

 

date Po_new Po_old diff1 Ng_new Ng_old diff2
7月11日 177 177 0 2,122 2,122 0
7月12日 50 50 0 789 789 0
7月13日 147 147 0 3,718 3,716 2
7月14日 207 206 1 3,282 3,272 10
7月15日 274 274 0 3,741 3,738 3
7月16日 321 319 2 3,896 3,895 1
7月17日 244 243 1 3,723 3,723 0
7月18日 181 181 0 2,527 2,526 1
7月19日 75 75 0 948 917 31
7月20日 202 200 2 3,425 3,374 51
7月21日 258 253 5 3,556 3,480 76
7月22日 307 304 3 4,481 4,322 159
7月23日 224 219 5 2,238 2,171 67
7月24日 95 94 1 1,270 1,225 45
7月25日 118 88 30 2,135 1,815 320
7月26日 83 80 3 1,077 997 80
7月27日 121     2,383    
             
sum     53     846

注1:

ジョブ型採用では、出来なかったら、できない人を首にして、できる人を雇うことが基本になります。そのため、大学等で社会人の再教育のコースが盛況になります。年功序列では、できなくとも首にはできないので、ファックスを使い続けるか、システムを更新と配置転をセットにして、できない人には難しくない仕事してもうらうこと(窓際族)になります。こうすると、労働生産性は最低になります。また、大学生は、会社はOJT(オンザ・ジョブ・トレーニング)で、採用時に大学の成績は見ないし、就職後できなくても首にはならないので、何とか就職しさえすればよいと考え、学生時代に勉強せずに、レジャーやバイトに精を出します。

引用

  • 都内の最新感染動向 最終更新 2020年7月28日 20:30

https://stopcovid19.metro.tokyo.lg.jp/