都道府県別に傾向を一覧で見たいとおもって、JSならほかの人にも見やすいだろうなと作ってみた。
新型コロナウィルス都道府県別感染者数の傾向
都道府県ごとの数値を見るだけであればNHKがまとめていたのだけど、時系列グラフがほしかった。
特設サイト 新型コロナウイルス 都道府県別の感染者数・感染者マップ|NHK
いまはNHKも都道府県を選択すれば個別のグラフが見えるようになっている。
一覧で見れることの他には、感染拡大度合いで地図の色付けをしているのと、感染拡大率のグラフを見れるようにした。
地図の色付けは、NHKや東洋経済など他のサイトでは感染者数で色付けをしているのだけど、一旦最高値の色になると変化がなく、また人口が少ない県では感染がひろまっても色付け基準にならないなど、ほとんど情報量がなくなってしまっている。
ここでは、感染拡大率によって色を変えているので、感染が拡大しているところは色がかわるし、感染拡大が落ち着くと色が戻る。
色は2日間の伸び率で決めていて、1.5倍だと赤い。これは1日あたり1.22倍で、アメリカで感染拡大がひどいとき1.2-1.3倍で伸びていたので、このくらいになると混乱がひどくなるというとこから決めている。色が日々変わる方がいいので、こちらは期間が短い。
感染拡大率は1週間で何倍になっているかの数字。1に近づくほど感染が収まっている。
地図のほうとは違って、ある程度安定した値が見たいので、7日間でみている。7日間にすることで曜日ごとの差も吸収できる。
緊急事態宣言でも、対象都道府県を決めるのに感染者数が2倍になる日数が重要な指標になっていたらしい。
感染者の急増、地方でも 2倍になる日数、富山で4日:朝日新聞デジタル
この拡大率rについて とすると感染者数が2倍になる日数を出せるので、これとリンクした数字になっている。
2なら1週間、1.6なら10日、3.3で4日くらい。
データとその収集方法
データは厚生労働省のサイトから「新型コロナウイルス感染症の現在の状況について」という資料が追加されるのを毎日チェックしている。
報道発表資料 2020年4月 |厚生労働省
これがHTMLがあったりなかったりで、結局PDFを見ることにした。
最初は福岡県がまとめていたのが便利だったのだけど、更新がいつになるかわからなかった。いまは更新が止まっている。
新型コロナウイルス感染症の発生状況についてお知らせします。 - 福岡県庁ホームページ
上に書いたNHKのサイトが見ているJSONが便利だったので、一瞬それを使った。
けど、結局もっと古いデータを使おうと思って、厚生労働省のデータを使うようになった。まとめられはじめたのが3/8からなので、そこから。
スクレイピングはJavaで書いていて、HTMLのスクレイピングはjsoupを使った。 jsoup Java HTML Parser, with the best of HTML5 DOM methods and CSS selectors.
けど、HTMLは厚生労働省のページに載っていたりのっていなかったりなので、必ず貼ってあるPDFを使うようにした。 PDFの読み込みではPDFBoxを使っている。 Apache PDFBox | A Java PDF Library
またこのPDFが気まぐれにフォーマットが変わるので、一応毎日チェックしながらやっている。
あと、4月の頭には福岡のデータが県が公表しているものと違ったので、手動で反映している。
いまは東京の死亡者数が都が公表しているものと違うので、こちらを手動で反映している。
JSライブラリ
JSライブラリは東洋経済のサイトを参考に、chart.jsとJapanMapを使っている。 新型コロナウイルス 国内感染の状況
このMapをog:imageに設定しているのだけど、これも手動でブラウザから保存している。
地図の表示を日付スライダー置いてアニメーションできたりしたら便利かなと思ったけど、JapanMapがデータ更新に対応していない感じなので、とりあえず保留。 JapanMap自体を書き換えるか。
終わりに
あとは入院数が見れればいいかなーという気持ち。
早くこういうデータに興味もたなくていい日が来るといいな。