近未来のジャーナリズム「3つのD」(3):データ分析は「常識」に ~ワシントンDC研究ノートその6

ミズーリー大学で行われたデータジャーナリズムのブートキャンプ授業風景(筆者撮影)

ローカルメディアも取り組んでいる

  これまでいくつかのジャーナリズムスクールや研究機関を訪れた経験について、これからのニュースのあり方を考えていくために3つのポイントにまとめて説明しています。

 みっつめのDは「データジャーナリズム Data Journalism」です。ニュースのエビデンス(根拠)として、交通事故の発生件数や学区ごとの高校進学率など、さまざまな形のデータを使って議論を補強することが一般的になっただけでなく、行政や企業の記録を集め、統一した基準で分析してみると、新しい事実が発見できるような、ニュースの新しい切り口の開拓が、かなり広く行われるようになりました。アメリカでは、かなり小規模のローカルメディアや、あるいはイシュー(課題)ベースで社会的な問題を議論する市民団体も、このような手法を使って情報を分析するようになっています。

 ミズーリー州の真ん中、コロンビア市にあるミズーリー大学には全米屈指の伝統を誇るジャーナリズムスクールがありますが、その傘下にIRE(Investigative Reporters and Editors Inc.)という非営利の組織があります。40年以上の歴史を持ち、文字通り、記者や編集者だけでなく、研究者や作家など、調査報道の手法を情報発信に生かして、客観的な説得力を強化したい人たちのために、トレーニングのプログラムや、そのためのリソースを提供しています。3月下旬に行われたIREの「コンピューター支援による報道ブートキャンプ(Computer Assisted Reporting Boot Camp)」を見学してきました。

ミズーリー大学のキャンパス。門の後方にある建物がジャーナリズムスクール(筆者撮影)
ミズーリー大学のキャンパス。門の後方にある建物がジャーナリズムスクール(筆者撮影)

 IREでは、1年に3~4回程度、このようなブートキャンプを開いて、毎回40~50人のジャーナリストたちが参加しています。私が見学した、コンピューター支援でデータを分析して報道に生かすトレーニングを提供するものと、分析したデータをtableauというソフトを使って、いかにわかりやすくビジュアライズ(可視化)するか工夫する、2種類のキャンプがあります。

世界の記者が集まってトレーニング

 参加者はミズーリー大学のジャーナリズム大学院を卒業し、地元セントルイスの「ポスト・ディスパッチ」紙に記者として仕事をする予定の卒業を間近に控えた女子学生から、50を超えたシニアの新聞の編集責任者まで、さまざまです。参加の動機を聞いてみると、その新聞記者として働く予定の女子学生は、「ジャーナリストとして、ひとつでも武器を身につけておく方がいいと思って。最初の担当は警察だって言われているので、データは役に立つと思う」。また、その編集責任者の女性はテキサス州の記者約30人の新聞社で働いており、「若い記者がデータを使っていろいろ記事を書いてくるようになった。自分もエクセルぐらい使いこなして、彼らの記事を正確にチェックできるようにならないと」と話していました。

ブートキャンプには約50人のジャーナリストが参加した。国籍、メディアの種類、経験はさまざまだ。(筆者撮影)
ブートキャンプには約50人のジャーナリストが参加した。国籍、メディアの種類、経験はさまざまだ。(筆者撮影)

 また、ある環境NGOのスタッフは「地元の一般の人から、川の水の内容物についてや、森の植物の分布など、たくさんのデータを受け取るんだけど、それをどのように身近な環境保護の議論に発展させればいいのか、考え方のヒントが欲しい」と、むしろ「ジャーナリズム的な着眼点」に関心があると話していました。ニュースメディアと公共政策に関わる一般の人たちの接点は、このように拡大しています。

 参加者の中には、アメリカだけでなく、ロシアやモルドバのジャーナリストもいました。アジアからは、インド、香港と中国、アメリカで育った中国人のAP通信のカメラマン(現在北京に駐在)がいました。英語の壁などがあり、日本からの参加者は「ほとんどいない。ここ数年では記憶にない」(IREシニア・トレーニング・ディレクターのドゥニース・マラン氏)とのことで、少し残念なことです。

エクセルは当たり前。さらに・・

 ブートキャンプでは、データを処理するエクセルやさらに大規模なデータを分析するSQL(シークウェル)などのソフトの使い方や、ソフトにデータを入力するためにデータの形式を揃える、いわゆる「データ・テーミング」などのスキルを学びます。さらに、集めたデータをどのような切り口で処理すれば、どのような問題を明らかにしてニュースにつなげることができるのかという発想法、そもそも、どこにデータがあるのかを探し当て、入手する交渉法も実例を示しながら議論し、経験を共有し合います。月曜朝から金曜の夕方まで、みっちりと5日間トレーニングを受けるのです。

 データジャーナリズムは一見、数学に強い人間が向いているかのように思えますが、むしろ、社会問題を議論するのにどのようなデータが必要かを論理的に考え、それを手に入れる戦略も必要です。ジャーナリストとしての総合力が問われる分野なのです。

 初日にエクセルの基本操作を習った後(シニアのジャーナリストはけっこうここで苦労していました)、最初に教材として与えられたのは、MLB(野球のメジャーリーグ)の選手年俸データです。これをチームごとに集計して比べてみたり、全球団のランキングを出したり、そこから上位の選手がいる球団ごとに、さらに球団のランキングを作ったり・・という作業は、現在もMLB関連のウェブサイトや、日本ではプロ野球でスポーツ新聞などが行っている通りです。「さらにどんなことができそうか、いろいろ考えてみて下さい」ということで、次のセッションに移ってしまったため、それ以上の議論は公式には行われなかったが、その後の休憩時間や、夕食の時に、参加者数人と意見交換したことをベースに、もう少し頭の体操をして、データでどのようなニュースの切り口を開拓することが可能か考えてみましょう。

社会に対する問題意識が問われる

 スポーツの世界では、「アドバンスト・スタッツ」という、選手のプレーすべてをデータ化し、相関を分析して、選手のクセや、チームがよく失点するパターンなどを発見し、作戦に役立てています。しかし、このブートキャンプの参加者は、ローカルメディアの記者や編集者が多かったこともあり、野球と地元社会で起きる出来事の相関関係を見出したいという関心が高いように思えました。

 年俸の高い選手を獲得して、チームの成績はアップしたのか、それとも地元のチームの評価は、成績だけでなく、チケットの売り上げを見なければいけないのではないか、Tシャツやキャップなどチームグッズの売り上げはどうか、テレビの視聴率はどうか、オフシーズンの地元のボランティアイベントに、チームのどの選手が一出ているかなど、チームが地元のチームとしてパフォーマンスを上げる効率的な投資を行っているのか、またそのようなチームスポーツが、ローカルコミュニティの強化に貢献しているかなどの議論ができそうだ、などの意見が出ました。

 アメリカでは、ヨーロッパのサッカーで問題となるフーリガンのような暴力的な行為はそんなに多くはありませんが、チームの勝敗と犯罪発生率の関係はどうか、チームが勝つと、どのような犯罪が多くなるか、どの地域で増えるのか、などは警察のデータと照合すれば、何か意味のある傾向がつかめるかも知れません。バーのビールの売り上げとの相関のように、地元経済への影響についても何か発見があるかもしれません。

検証と分析は完璧をめざす

 そのような発想からデータを分析していきますが、このブートキャンプでは、ニュースにするためにチェックを重ね、間違いをつぶし、論理的に飛躍したり、矛盾したりする表現が使われていないかなど、万全のチェックをするように強調しています。「防弾(Bulletproofing)」と呼んでいます。データの検証やニュースの内容は複数のスタッフが相互にチェックし合いながら進めるように徹底し、例えばニュースの予告編など短いメッセージにしたときにミスリードを引き起こす表現が紛れこまないようにするとか、ニュースの根拠になったオリジナルのデータも、ウェブサイトに公開して、データ分析の手続きの透明性を確保することなど、細かいチェック項目があります。データ分析ではしばしば、隠れていた大きな問題が発見され、重要なニュースに発展するケースも多く、それだけに、データを客観的に分析し、論理的に無理のない結論を導き報道しなければ、ニュースメディアとして予期しない反論や攻撃も受けるリスクとも、隣り合わせだからです。

 データは過去と現在、あるいは地域ごとなど、比較の中から問題が発見されることが多いものです。しかし、そのデータを記録する前提が食い違っていたり、データが不完全だったりすることもしばしば起こります。その場合は、他のデータを探し出すなどして前提条件を揃えて比較ができるまで、結論を持ち越してニュースにするのを踏みとどまったり、あるいは自らデータを取って検証するなど、必要な追加の作業を行うなどの判断が必要になります。

マップ作成に4カ月も

 2017年にインディアナ州のローカル局WTHRが、州内にドラッグの使用形跡のある家屋は洗浄作業を行ってから住まなければならない法律があるにもかかわらず、作業が追いつかず、約3000軒がメタンフェタミンというドラッグに汚染された家に住んでいるという深刻な健康被害を明らかにしたスクープ報道で、取材チームはインディアナ州警察や環境保護局など13種類のデータを集め、何地点もの洗浄処理が行われていない家が、駐車場の一部として登録されていたり、反対に汚染のため取り壊されてしまったりした家が、まだ使われているものとして登録されているなど、データの不備を発見しました。そこで、400地点以上を実際に訪れ、危険な家をひとつひとつ確認した後にニュースとして発表し、インタラクティブな地図を作って警告を発しました。4カ月の期間を要しました。

WTHRのニュースのページ
WTHRのニュースのページ

 IREはブートキャンプの他にも、全米のジャーナリストが参加するイベントなども催しています。4日間で150を超えるセッションでは、成功例だけでなく、記事の取り下げなどに至った失敗事例も共有され、ノウハウを共有、蓄積していきます。

データ入手もスキルが必要

 データジャーナリズムでは、分析する以前にデータを手に入れることに多大なエネルギーを注がなければならないこともあります。ブートキャンプではデータを探して存在を確認し、エクセルやSQLなどの分析ソフトにインポートしやすい形で入手するためのノウハウについても詳しく学びます。

データの入手法と交渉に関するセッションの様子(筆者撮影)
データの入手法と交渉に関するセッションの様子(筆者撮影)

 まず、行政や企業はデータを持っていても、積極的にそのことを公にしていないことも多いので、どこに、どのようなデータが蓄積されているのか、存在を確かめるところから、データジャーナリズムの取材は始まります。政府と市民の間に何らかのやりとりが発生すれば、データが生まれ、情報は公共のものとなり、ジャーナリストも市民も費用がかからず入手できるのが原則です。

データジャーナリズムのヒント

 アメリカではFOIA(情報公開法)に基づいて、連邦政府や州政府などにデータを請求します。その後の手続きを行うテクニックなどの議論は専門の方に委ねますが、ここではブートキャンプのディスカッションで出てきた興味深かったポイントを、いくつか書き留めておきます。日本でデータジャーナリズムや情報公開の仕事をしている方にとって何らかのヒントや、一般の読者の方がデータジャーナリズムの現場を想像する際の手がかりになればと思います。

・報道機関は、基本的なデータ(予算や決算、職員の給与、取引のある業者と実績、有権者数など)は取得して保存しておくべき。定期的に更新しておけば、新しいニュースの分析に使うことができる。

・必要な時すぐにアドバイスを求められるIT技術者が必要である。

・情報公開に関する法律を知り、情報はどのようなサイクルで公開扱いとされるか、またデータはどのような形で公開されるかを知らなければならない。

・行政や企業のデータ関連部署の人たちと、同じ専門用語を使えるようになっておくべきである。

・役所に空欄を記入するフォームが置いてあれば、それに関するデータが存在するはずである。

・情報公開の交渉も記録が重要だ、すべてのコミュニケーションを記録し、必要なら電話の会話も録音しておくべきである。

・データの提供をお願いする公式な要請状のテンプレートを準備し、会社のレターヘッドが入った正式なお願いの形で提出しなければならない。

・データの分析前にもニュースとして発信し、その分野への関心を示して、情報を持っている組織にも、読者にも認識してもらった方がいい。

・データ、あるいは情報公開の担当者からは、以下のような返答が来る場合が多いが、あきらめず交渉を続けるべきである。

 「ご要請のような情報を集計したデータは存在しません」

 「外部と共有できない特別なプログラムで運用しているので、データのエクスポートはできません」

 「提供した情報をそちらがどのように扱うか保証ができないので提供を見送らせていただきます」・・・など。

・断られても、粘り強く他の方法を考えるべきである。

- もう一度申請する

- データを管理するさらに上部の組織にアプローチする

- 同じような問題でデータを得られた事例を見つけて再交渉する

- 情報公開に難色を示すという事例は透明性の問題としてニュースに取り上げることができるかもしれない・・・など。

IREでは情報公開に非協力的な政府機関に「金の南京錠」賞を出して警告を発している。(筆者撮影)
IREでは情報公開に非協力的な政府機関に「金の南京錠」賞を出して警告を発している。(筆者撮影)

 ブートキャンプの参加者の何人かは、現在取材中の自分のプロジェクトのデータを持ち込んでいました。記事化したい問題を明らかにするのに充分かなど、毎日午後のセッション終了後に講師から個人的にコーチングを受けていました。前回や前々回の議論で取り上げたUCバークレーのジャーナリズムスクールのプロジェクトにも、フレズノ市の警察が、白人よりも黒人やヒスパニックのドライバーを停止させ、車内を捜索する率が人口比率以上に高いことを警察に保存された記録をデータ化し、明らかにしたものがあります(「誰のための公正なのか Justice For Who? 」)。インターネットやスマートフォン上のニュースでは、印刷の新聞やテレビと違ってインタラクティブな機能を使えるため、ユーザーの理解度に合わせたデータの見せ方が可能で大きな利点があります。デジタル・ストーリーテリングでは、欠かせないコンテンツのひとつとなりそうです。