歴史的魚拓。アメリカ連邦政府のウェブとデータをバックアップせよ。
1月20日、ドナルド・トランプ氏がアメリカの新大統領に就任するまさにその時、カリフォルニア大学ロサンゼルス校に約60人のプログラマーやデータ・サイエンティストたちが集まりました。
彼らがしたことは、限られた時間の中で、連邦政府のウェブサイトや、掲載されているデータセットのバックアップを取ること。
- エネルギー省の太陽光発電イニシアチブに特化したWebページ
- 化石燃料と再生可能エネルギー源を比較したエネルギー情報管理データセット
- 国立再生可能エネルギー研究所の燃料電池研究
- 気候と環境データ
などなど数百のウェブページやデータセットが対象となりました。
この日の実施はシンボリックなイベントですが、この動きはこの日に突然始まった訳ではなく、ここ数週間、カナダのトロント、フィラデルフィア州、シカゴ州、インディアナポリス州、ミシガン州でボランティア・ベースのイベントが開かれ、環境保護庁(EPA.gov)、NASA(NASA.gov)、エネルギー省(DOE.gov、現在のenergy.gov)、ホワイトハウス(whitehouse.gov)から数十万ページをダウンロードし、別なサーバにアップロードする、ということを続けていたとqz.comが伝えています。
ウェブページは、インターネット・アーカイブ(彼らのファイル・フォーマットがISOとして標準化するなど、ウェブアーカイブについて中心的な民間の団体)やカナダのPage Freezerというバックアップ・ソリューションの会社のサーバへ。
大規模なデータセットは一部をdatarefuge.orgへ(CKANというオープンソースのデータポータルサイトを利用)。
それぞれバックアップを取ったとのことです。AWSを利用しているサイトはリージョンが不明なのと、全体のうち割合は不明ですが、ヨーロッパやカナダにあるアメリカ国外のサーバでもデータが保管されています。
ちょうど日本国内でウェブ・アーカイブを実施している行政機関の中の人から私が先週伺った話によると、インターネット・アーカイブが実施しているようなISO標準のファイルフォーマットでのウェブの収集方法では、ブラウザ上で実行が必要なページについては収集されないとのことで、そういったページやデータ(たとえばWiredの記事では「温室効果ガス排出量のインタラクティブマップ」が紹介されてました)については慎重に個別対応をしていったようです。
こうした動きがはじまっていたところ、実際に、環境保護庁(EPA)の政権移行チームが気候データを省庁のウェブサイトから削除したことが明らかになり、可及的速やかに寝る間を惜しんでバックアップ作業が続けられた、とのことです。
これまでの連邦政府の方針と真逆の閣僚人事
アメリカ在住の町山智浩さんがTBSラジオ番組「たまむすび」で語った、連邦政府の閣僚人事と人物評を聞くと、どうやらこれまでのそれぞれの省庁の方針とは真逆の人物を割り当てる考えのようです。非公式ですが番組のログページがあります。
この記事をアンカーに、さらに詳しく随時情報が更新されている以下の記事から、閣僚人事案の一部を引用します。閣僚一覧は現時点(1月23日)では案であり、議会の審議を経ての確定をしていないものです。
国務長官:(日本でいう外務大臣)レックス・ティラーソン氏。エクソン・モービル会長兼CEOで、ロシアの会社と合弁で天然ガス開発を行い、プーチン氏から友好勲章を授与されたこともある方。
司法長官:ジェフ・セッションズ氏。共和党上院議員で、ハンフィントンポストが「リベラルを恐怖に陥れた理由が8つ」として、マーティン・ルーサー・キング牧師の側近を含む黒人公民権運動家を訴追したなど、過去の行動について事例をあげています。人種差別・性差別的な傾向のある人物。
財務長官:スティーブン・ムニューチン氏。ウォール街を規制する側に、元ゴールドマンサックス幹部。
エネルギー長官:リック・ペリー氏。元テキサス州知事で、かつてエネルギー省廃止を訴えたこともあるとのこと。町山さんによると、エネルギー省の業務内容自体を誤解しているのでは、とのことです。
環境保護局長官:スコット・プルイット氏。オクラホマ州司法長官で、オバマ政権の火力発電所のCO2排出規制に反発し、無効訴訟を起し、結果この規制をオバマ政権では導入できなくなったとのこと。トランプ氏と同じく、地球温暖化の原因がCO2排出だとする説に懐疑的な人物です。
保健福祉長官:トム・プライス氏(共和党下院議員)。医療保険制度改革法(オバマケア)の廃止法案を立案したのオバマケア反対派。
LGBTQ差別に反対する動き、オバマケア、温暖化対策などオバマ政権時の主要政策への逆張りというだけでなく、他国への影響という意味では経済政策の動向なども、気になるところです。
さらに詳しく知るためには上記サイトや、インターネットで情報を探してぜひご覧になってください。
連邦政府サイトの差分(追加や削除などの変化)情報を定期配信
そして、最初の話に戻りますと、新政権の最初の100日間の経過以降は、Data Refuge(「データの避難」 )というサイトが、連邦政府のウェブサイトをスキャンし、Page Freezer社の仕組みを使って、今回取ったバックアップとの差分を明らかにし、ニュースレターの形で定期的に公表していく、とのことです。
こういう動きを伝えること自体が、情緒的にトランプ氏が悪であるという印象を持たれるかもしれません。実際には政策の方向性がどういう効果があったかはまさにデータによって検証されるべきです。現時点では、都合の悪いウェブやデータはトランプ政権がすべて削除するのである、という予断は持たずに、今後の実際の差分検証によって明らかにされていくべきでしょう。オバマ政権で大きく前進した、オープン・ガバメント、オープン・データなどの取り組みがどう変化していくかについて、注視していきたいと思います。
追記
その1
ハッシュタグは、#datarefuge #datarescueといったもので参加してる人たちのツイートを眺めることができます。
その2
アメリカ国立公文書記録管理局インターネット・アーカイブにオバマ政権時のホワイトハウス専用サイトができています。
その3
オープン・ガバメントについての多国間連携(Open Government Partnership)についての記事がすでにホワイトハウス(whitehouse.gov)のサイトから削除されているようです。
【1月24日15:40追記】
ホワイトハウス(whitehouse.gov )については、一旦リプレースがなされるのが通例のようですので、現時点ではホワイトハウス(whitehouse.gov )については、差分うんぬんの話ではないようです。
https://twitter.com/nacin/status/822581577502912512