まるで大喜利?『国民の祝日』データをもっと真剣に考えてほしい これが政府の考える『オープンデータ』だ

KNNポール神田です。

□(2019年)4月29日(月・祝日)にNHK総合で放送される同番組は、昨年69回目を迎えた『NHK紅白歌合戦』から、平成30年分の放送を振り返るもの。全2部で構成され、第1部は19:30、第2部は22:00からオンエアされる。

出典:NHK『総決算!平成紅白歌合戦』第2部に内村光良&バナナマンが出演

■平成時代の大晦日となる『紅白歌合戦』

平成時代の紅白歌合戦が、2019年4月29日(月・祝日)の19:30から始まる。いわば、平成の大晦日(おおみそか)版ともいえるだろう。そう、『10連休(2019年4月27日土曜日~5月6日月曜日)』という大型連休にはいっているからだ。平成の天皇誕生日が12月23日であり、それからクリスマスイブを迎え大晦日とお正月の三が日。今回の大型連休は、紅白歌合戦で、そんな平成最後の『大晦日』気分になりそうだ。しかし、10日も空白期間ができることのリスクも多い。

10連休 ATMの残高不足やサイバー攻撃に注意

「令和」改元に伴う10連休のセキュリティ対策は早めに--IPAが呼び掛け

■むりやりの10連休にするための『国民の祝日』動員

『働き方改革』とは、働き方の改革ではなく、休み方を増や側に注目されているようだ。しかし、休めば休むほど、そのしわ寄せが増えるばかりだ…。

「天皇の即位の日及び即位礼正殿の儀の行われる日を休日とする法律」出典:内閣府
「天皇の即位の日及び即位礼正殿の儀の行われる日を休日とする法律」出典:内閣府

日付,曜日,名称,備考

2019/04/27,土曜日,

2019/04/28,日曜日,

2019/04/29,月曜日,昭和の日,昭和天皇誕生日 元みどりの日

2019/04/30,火曜日,休日, 休日と休日にはさまれたので休日

2019/05/01,水曜日,祝日扱い,令和天皇 即位礼正殿の儀

2019/05/02,木曜日,休日,休日と休日にはさまれたので休日)

2019/05/03,金曜日,憲法記念日,日本国憲法が施行

2019/05/04,土曜日,みどりの日,閣議決定で決定

2019/05/05,日曜日,こどもの日,

2019/05/06,月曜日,休日,振替休日

国民の祝日に関する法律(昭和23年法律第178号)

https://www8.cao.go.jp/chosei/shukujitsu/gaiyou.html?fbclid=IwAR1VjPtuj9DeYAfnk0QA1UMXHgvxt5-BnGOLt8s31FFhpbyV1VF78CIEYVg

かつては飛び石連休だったゴールデンウイークはもはや、週休2日のサラリーマン全員が享受できる休みにしてしまった。中小企業のサラリーマンも『国民の休日』だから気兼ねなく休める。当然お役所も閉まるので、手続きは遅れる。世界の株式市場から10日間も逸脱するガラパゴスな国である。一億総ゴールデンウイークによって、旅行はすべてピーク料金。どこも人でいっぱい。サービス産業従事者は休み無し。休み多くして、給与はかわらず、どこもが正月料金となる。国民が、一斉に休むことによっての連帯主義は、労働生産性の低さをさらに低下させ、労働時間だけをさらに引き上げる結果になるだろう。

振替休日』は、46年前の今日、1973年4月12日、祝日法(国民の祝日に関する法律)が改正されて誕生する。『祝日法』は、1948(昭和23)年7月20日に公布され施行された。

■政府のオープンデータの『国民の休日』はなぜ?CSV形式なのか?

AI時代になり人工知能が、休日の需給予測や渋滞を予測するが、そのデータは個々の事業者が各自で入力している。むしろ、オープンデータで『国民の休日』100年分を、現在の法則性でAPIで提供すれば、『国民の休日』による経済効果測定や渋滞予測、混雑予測など把握でき、キャッシュレス化とつながるとGDPの成長性の糸口もみえてくるのは誰もが理解できる。

しかしだ…。実際に政府のオープンデータを一度でいいから見てみてほしい…。この国を司る人たちのITリテラシーのなさに驚愕してしまう。開いてみて、どうか…驚かないでほしい…。

国民の祝日・休日月日,国民の祝日・休日名称

2019/1/1,元日

2019/1/14,成人の日

2019/2/11,建国記念の日

2019/3/21,春分の日

2019/4/29,昭和の日

2019/4/30,休日

2019/5/1,休日(祝日扱い)

2019/5/2,休日

2019/5/3,憲法記念日

2019/5/4,みどりの日

2019/5/5,こどもの日

2019/5/6,休日

2019/7/15,海の日

2019/8/11,山の日

2019/8/12,休日

2019/9/16,敬老の日

2019/9/23,秋分の日

2019/10/14,体育の日(スポーツの日)

2019/10/22,休日(祝日扱い)

2019/11/3,文化の日

2019/11/4,休日

2019/11/23,勤労感謝の日

2020/1/1,元日

2020/1/13,成人の日

2020/2/11,建国記念の日

2020/2/23,天皇誕生日

2020/2/24,休日

2020/3/20,春分の日

2020/4/29,昭和の日

2020/5/3,憲法記念日

2020/5/4,みどりの日

2020/5/5,こどもの日

2020/5/6,休日

2020/7/23,海の日

2020/7/24,スポーツの日

2020/8/10,山の日

2020/9/21,敬老の日

2020/9/22,秋分の日

2020/11/3,文化の日

2020/11/23,勤労感謝の日

https://www8.cao.go.jp/chosei/shukujitsu/syukujitsu.csv?fbclid=IwAR135olNP-JfaPG3DqOkcpjZ7xy0fMHLD7ZcrYTzZSltXmNUXI2R1gZV00U

大臣官房総務課の仕事は、お世辞にも、すばらしすぎて絶句ものだ。CSV形式で2KB

「国民の祝日」データとリソース 出典:data.go.jp
「国民の祝日」データとリソース 出典:data.go.jp

https://www.data.go.jp/data/dataset/cao_20160323_0068

たったこれだけしかないのだ!

なんと単なるExcelのCSVファイルにすぎない。2年先までしかわからない。休日にはさまれた平日は休日になるというアルゴリズムはどこにもない。『ハッピーマンデー制度』も反映されない。法律が変わった際に日付データの自動更新機能もない。また、『春分の日』『秋分の日』は国立天文台が「暦要項(れきようこう)」で発表するという。

祝日としての春分の日・秋分の日は、前年の2月1日に、春分の日・秋分の日の日付が書かれた「暦要項(れきようこう)」が官報に掲載されることによって、正式決定となるが、2030年までの予測はすでに発表されている。

https://www.nao.ac.jp/faq/a0301.html

ここまででているのだから、内閣府およびhttps://www.data.go.jp/ は、2050年くらいまでの現行においての正しい休日データを公開すれば、民間事業社はそのデータで需給予測を立てやすい。もちろん過去の国民の休日データがあれば、100年単位での休日の行動傾向がわかるはずだ。

※追記:CSV ファイルそのものに問題があるわけではないとご指摘をいただきました。

しかも、こんな汚いCSVファイルだと、プログラムにも利用できない…。

※追記 こちらの部分については、現在修正されているCSVファイルになっている。

内閣府で使っているままのExcelのCSV出力なのだろう…ショック。

※追記

□ただCSV形式はSJISかUTF-8かの問題を抱えているのがやっかい。日本人がExcelで見やすいのはSJIS、iPhoneなどで閲覧できるのはUTF-8。ここは非エンジニア視点は捨てて、政府提供CSVの基本はUTF-8にすることを提唱したい。

出典:オープンデータ伝道師でエンジニアが解説する「国民の祝日オープンデータ」の問題3つと解決策

■オープンデータ伝道師の福野泰介さんが作られた政府のCSVからのカレンダー。

日本の国民の祝日オープンデータカレンダー 出典:fukuno.jig.jp
日本の国民の祝日オープンデータカレンダー 出典:fukuno.jig.jp

内閣府が『曜日』もつけてくれればカレンダーの使い勝手も増える。月曜日はじまり。もちろん、目視で確認しやすい。政府のURLが、現在から変わらなければだが…。

https://fukuno.jig.jp/app/csv/publicholiday-japan.html

■『平成32年』以降の表記はすべて『令和XX年&西暦』に置換すべき。さらに『元号関数』に置き換える

『平成32年』標記が直されないまま… 出典:内閣府
『平成32年』標記が直されないまま… 出典:内閣府

行政文書は、基本的に元号表記だが、元号が二世代変わると、もう何年前なのかがイメージしにくい。平成32年以降の運転免許もすでに発行されている。まずは、平成32年以降の行政文書はすべて『令和XX年&西暦』に置換すべきだ。いや、むしろ文言を単に置換するだけでなく、『元号関数』を提供し、元号と西暦の二重表記をデジタル化されている文書の中では適応すべきだと思う。

明治、大正、昭和、平成、令和と4つの元号を『関数』として、文書で表記すれば、データの閲覧性は非常に高まる。

PDFの文書も、4つの元号書体と漢数字の『画像認識エンジン』を提供すれば、プラグインを活用すれば『元号&西暦』表示が可能となるだろう。

『改元』を機会として、行政や政府文書を『日付関数』で処理するチャンスでもあるのだ。行政文書を『メタデータ』化することによって、消えた文書とか廃棄してしまった契約書問題などもおきにくい。政治家の『政治資金収支報告書』なども、提出時と共にAPI公開もできる。現在の1年半遅れの公開では、議員を辞職してから不正が発覚しても遅い。

■『国民の休日 オープンデータ』で検索すると検索できないという仕様

検索の上位に表示される、data.go.jpのファイルはいつも表示されない。

『国民の休日 オープンデータ』で検索

■『国民の休日』データに法則性と本当のデータケイパビリティを!

どれだけ、民間のAIやIoTが進化しようとも、データの大元を決める側が、このような稚拙なデータでは使いようがない。政府のデータを利用してもらい、利用側のデータをもって統計調査に活用するなどのデータのケイパビリティ(能力)を活かすべきだ。数値データもPDFやExcelファイルだけではなく、関連・連携した省庁とのデータももっと、まとめるべきだろう。

数値化されたデータを紙ベースで発表するだけでなく、データが資産となる作り方を考えない限り、生産性はまったくあがらない。

カレンダー業者が困るだけでなく、ビッグデータもAIも国民の働き方、休み方を分析することができない。

筆者もPythonでクロールできるところがあれば、いろんなサービスを提供したいアイデアがあっても、クロール先がなければ自分で一からデータを集めなければならない。そう、個々がバラバラのデータで、同じものを作るのが一番生産性がない。

せめて、Githubに、ソースを公開するくらいの閣議の意思決定があるべきだ。

オープンガバメントを標榜すればするほど、ムダな『IT投資』という名のバラマキばかりで、情けなくなる。

「e-Japan 戦略」や「電子行政推進」「高度情報通信ネットワーク社会推進戦略本部」でかけた時間とカネはどこへ消えた?

「電子行政」も会議の予算がなくなったら…終わってしまっている。

一度作ったデータはみんなで使いまわす。それがエコであり、効率的であり、合理性でもある。

もはや紙の文書はブラウズのためにすぎず、最終アウトプットではない。データは検索性があり、参照できないとデータの意味がない。

※追記

『都道府県別のオープンデータの活用率』が政府のオープンデータを活用してビジュアル化されている。政府は、2020年に100%を目指しているが、足をひっぱっている県が一目瞭然だ。

「日本のオープンデータ都市率ダッシュボード」出典:fukuno.jig.jp
「日本のオープンデータ都市率ダッシュボード」出典:fukuno.jig.jp

https://fukuno.jig.jp/app/opendatacity/citiesratio7x7.html

『カラム地図』はgithubでもソースが公開されている。

https://github.com/tabularmaps/tabularmapsmaker

数値を打ち込むだけで作れる『都道府県カラム地図メーカー』

https://tabularmaps.github.io/tabularmapsmaker/highlow.html