東京都公式と厚労省公式で二倍異なる、東京都での COVID-19 死亡者数
※記事公開後のデータ更新について
週に一度程度ですが、データを更新したチャートを筆者のブログ・サイトへ掲載しています。
東京都公式と厚労省公式で異なる死亡者数
上記チャート画像をご覧ください(拡大画像はこちら)。東京都内でCOVID-19関連で亡くなった方の人数、今日(4月14日)の時点で、東京都公式の数値(42名)が厚労省公式(19名)の二倍以上なんですよね。
データはそれぞれ以下の、公式に準ずるGitHubレポジトリから取得しています。
これは一体どういうことなのでしょうか。厚労省のサイトを読むと、補足自体は以前からなされており、
とのことで、突合作業中のため計上していない人数が、全都道府県対象で30名、おそらくそのうち東京都対象が23名(東京都公式と厚労省公式の差分)ということなのでしょう。
海外向けには突合作業中を除く死亡者数を報告
全都道府県分からの集計から、突合作業中の30名を除く人数が厚労省の公式見解であり、WHOにもそのように報告されています。
4月13日時点、102名。
WHO・4月13日時点のSituation report - 84
厚生労働省・新型コロナウイルス感染症の現在の状況と厚生労働省の対応について(令和2年4月13日版)
この辺りは判断基準含め、国民へ丁寧に説明がほしいところです。
被害状況が何月何日に何人だったかという時系列のデータが公表されていない
上記とは少し別の話ですが、被害状況が何月何日に何人だったという、厚労省公式の時系列のデータが公表されていません。
現場のワークフローは知らないのでこれは推測ですが、たとえば国政選挙の結果は総務省のサイトに掲載されています。
選挙の結果はまず、速報性を優先させた速報値が出ます。後日、確定した値として確定値がでます。
厚労省の「新型コロナウイルス感染症について」というページをみると、ところどころに、速報、確定という言葉が登場しますので、同様に、速報値と確定値の少なくとも2つの状態を使い分ける考え方で運用していると思われます。
選挙の場合は、投票をしめきってから、データが新たに追加で発生することは基本的にはありません。
今回の新型コロナウイルス感染症の場合、日々毎日データが新たに発生し続けます。さらに過去にさかのぼって速報値が確定値へと訂正されていきます。その結果が、日々厚労省のサイトへ公開されます。その際、いったん公開された報道機関向けの、過去の表データ画像は訂正されません。そのため、現在から過去にさかのぼって表データ画像を見比べても、もしくは表データ画像から数値を文字起こしして時系列データとして扱おうにも、外部からは整合性を確認しようがありません。どの部分が速報値で、どの部分が確定値なのか、そしてどの部分が訂正がなされたのかが不明なのですから。
過去の報道発表資料をさかのぼって常に更新してほしいということではなく、私が言いたいのは、それらとは別に、確定値のみをまとめた、もしくは一部が速報値であってもそれが明示されている、時系列での発生状況の最新版をまとめた、独立したデータファイルの公表が必要なのではないでしょうか、ということです。
データファイルと書いたのは「表データ画像」もしくは「PDF化された表データ」ではなく何らかのアプリで直接扱うことが可能なファイル、という意味です。
日々の変化を知るために、データは時系列でなければならない
毎日、最新の累計(集計された)データは公表されていますが、これは時系列データではありません。過去にさかのぼって今日に至るまで、被害状況が何月何日に何人だったか、最新の状況を反映した時系列のデータが必要です。
時系列のデータというのは、被害状況の変化そのものであり、今回の場合は、注視しなければならない指数関数的変化そのものであり、懸念されているオーバーシュートを測る指標そのものだからです。