9024. データはリアルタイムには反映されません

自分でデータを「取る」苦労をしている西浦先生は、完全に反映されたデータのある日付で、「切って」ます。

宮沢さんはデータが出揃ってない資料で「下がった」「下がった」と騒ぐから、外れるんですよ。

辛坊)夕刊フジ、今日10日の3面の見出し…… 『東京 コロナ第3波 すでにピークアウトしていた』京都大ウィルス・再生医科学研究所 宮沢孝幸准教授が明言 ~『夕刊フジ』2020年12月10日記事 より ―– 辛坊)確かにいま連日最多更新、本日(12月10日)も新規感染者602人みたいなことになっています。この記事によりますと…… 無症状者などを除く「発症日別による陽性者数の推移」をみると様相は異なる。新規陽性者は11月17日に318人に達した後は200人台で推移するなど徐々に減り、今月4日が152人、5日が118人、8日が21人となっているのだ。 宮沢氏は、「発症日ベースで考えれば、東京都では11月17日にピークアウトが起きたのはデータから明らかだ。感染から4日から14日程度で発症するため、感染日ベースなら11月10日前後にピークアウトしたことになる」と解説。「都が飲食店に営業時間短縮を要請したのは11月28日だから、自粛に関係なく、自然減であると考えられる」と指摘する。 ~『夕刊フジ』2020年12月10日記事 より

https://news.yahoo.co.jp/articles/bc10292103d7f25ed878fd0f7723dcce4bc22b50

辛抱が恥をかかされたと気づくのは、この先のことです。

発症日ベースのデータは反映されてくるのが遅いからね。それに、最初は無症状に見えたけど後から重症化してきたのは、反映されないこともあって、過小評価に繋がるリスクがある。

自分で数字を集めてる人なら、そのへんの匙加減がわかるけど、現場にいない現場主義の先生には、リアルタイムに、自動的に数字が更新されていくと思ってるフシがある。

データクリーンニングの作業が、数式よりも大事だって、わかってないんだろうな。この手の仕事をやったことがないから。 in vitroとは違うんだよ、人間は。

統計ってのは、データの品質管理が大事。WHOにいた尾身さんたちは途上国のデータがいかに当てにならないかを知ってて、自分たちがデータを「取る」システムを構築するところから参画する。

IT関係の人たちは、泥臭くデータを取ってくる所の原始的初歩的なシステム破綻を冷たく笑ってるだけの人もいれば、なんとか助けてやろうという人もいる。西浦さんたちの額に汗する思いで格闘するエネルギーがあって、始めて、データ解析の土台が出来てるんだと、わからない人は、危ないデータと信頼できるデータの区別がつかない。

日本において、保健所のキャパオーバーになるとデータの反映する時間が遅くなり(入力する人が潰れてしまう)感染拡大がデータの上で見えなくなって行く。データも「なまもの」なんだと扱ったことがない人には、感覚的にわからないんだろうと痛々しく見ている。(っていうと、システムの不備をドヤ顔で指摘するだけだろうけど、そんなこと、わかった上でも仕事しなくちゃならないのが現場ってもんですから、システムエンジニアでもない人が外でギャーギャー騒がないで欲しい。うざいだけだから。)