オリンピック、国ごとの成績を比較するのに、獲得メダル数の単純な合計はフェアなのか
リオ・オリンピックが幕を閉じました。閉会式での日本への引き継ぎセレモニーも印象的でしたね。
私は岐阜は大垣で東南アジアやブラジルからきたひとたちと数日間、終日ワークショップに参加していたのでほとんど見ることができなかったのですが、ちょうどオリンピック開催中にリオ・デ・ジャネイロから大垣へやってきたナイス・ガイが、使い捨てのビニール傘を分解して別なものに作り替えようとしていたのを手伝ってました。これが君のオリンピックだね、とか言いながら。
閑話休題。
獲得メダル数の合計
オリンピックは国ごとにチームを結成し競うものである以上、国単位での順位を表すのに獲得メダルの数の合計が利用されることが多いですね。ただここで、メダルの合計数だけでは比較が単純すぎないか、と考えた人がいました。国ごとに財政やスポーツにかける予算、人口やスポーツ人口、スポーツの人気度といった状態は異なるので、これらの切り口が仮に同一だったら「メダル数の合計順位」はどのように変わるのか。
グーグルの「もうひとつのメダル順位」(Alternative Olympics medal table)というコンテンツを紹介します。
もうひとつのメダル順位
切り口は五つ。
- 人口(世界銀行のデータセット)
- GDP(世界銀行のデータセット)
- オリンピック・ラブ度...2016年オリンピック(Olympics in 2016)についてのグーグル検索結果
- スポーツ・ファン度...スポーツ参加(sport participation)についてのグーグル検索結果
- 健康食度...健康食(healthy eating)についてのグーグル検索結果
利用データセットがエクセルファイルで「遊んでいいよ」と公開されてますが、残念ながらメダル数は含まれていません。
気になる結果は
通常の集計
日本は6位。
人口が共通だったら
バハマが一躍トップに躍り出てきました。日本は10位。
GDPが共通だったら
フィジーが一躍トップに躍り出てきました。ジャマイカもグッと順位をあげています。日本は13位。
オリンピック・ラブ度
あまり大きな変化は見られず。日本は5位。
スポーツ・ファン度
アメリカとロシアがスポーツ・ファンの応援具合からも二大国であることがよくわかります。日本は6位。
健康食度
アメリカがダントツなのが正直意外です。日本は5位。
国ごとに順位をまとめてみていくこともできます
グーグル検索結果に基づく後者3つは中国がランク最下位近くへ行ってしまいますね。
作者はデータジャーナリズムの先駆けのサイモン・ロジャース
グーグルのサイモン・ロジャースさんらのチームで、サイモン・ロジャースさんはもともとイギリスのガーディアン紙に所属して、Datablogというデータジャーナリズムの先駆けコンテンツの初期メンバーだった人です。2012年のロンドンオリンピックのときにも同様のアイデアでコンテンツを作っていました。今回このコンテンツも当時一緒に作った人と(ほか数名と)で取り組んだそうです。
データの意義を国民的イベントで問う
サイモンさんは今回の作品の意義を「データの価値を国民的イベントにからめて提供する機会があるならやるべきだと思った。」と語り、共同で作業したデータサイエンティストのクリストフォロス・アナグノストポロスさんは『人生に「ほかの条件がすべて平等だったら」といったことはないかもしれないが、データサイエンスでなら、シミュレーションは可能。もしジャマイカのスポーツ選手がアメリカほどの財政に恵まれていたらどんな可能性があるか示せた。』(一部略)と語っています。
2012年のロンドンオリンピックのときはオープンデータの概念、機運がヨーロッパで盛り上がってきて最初のオリンピックだったため、過去のオリンピックを遡って競技結果をオープンデータ化する動きが、イギリスのガーディアン紙やアメリカのニューヨークタイムス紙などでみられました。
2020年、東京オリンピック・パラリンピックの際には、どんなデータ・セットで何を語ったら興味深いか、今から思索の旅に出てもいいかもしれません。