テニスもビッグデータの時代!? テニスの新時代を開拓するIBM社のイノベーション(1)
チャレンジ(ビデオ判定)システムや、リアルタイムでのスタッツ表示、そしてそれら膨大な情報を用いてのコーチング――。
今やテニスの世界も、ビッグデータを収集・解析し、多方面で活用する時代だ。
テニス界で最高権威を誇る四大大会(全豪、全仏、ウィンブルドン、全米)で、それらデータ解析及び情報提供を行なっているのが、多国籍インフォメーション・テクノロジー社として名高い、IBMである。
先月末から9月上旬にかけてニューヨークで開催されたUSオープンでは、IBMが誇るテクノロジーを用いた、テレビ視聴者や観客を楽しませる種々の情報提供等が行われていた。同時にIBMは、全米テニス協会(USTA)の公式情報コンサルタントとして、様々な形でアメリカの選手たちのサポートを行なっているという。
そこでここでは、IBMが行なっているイノベーティブな活動のうちの幾つかを、3回に渡って紹介する。
■ライブスコアで表示される、“KEYS=勝利への鍵”要素■
これはUSオープンに限らず、全てのグランドスラムでIBMが提供しているサービス。
大会の公式ウェブサイトやスマホ用アプリでは、試合のスコアやスタッツをリアルタイムで確認できる“ライブスコア”を見ることが可能だ。
その中に“KEYS”という項目がある。これは、対戦する両選手それぞれに、文字通り“勝利への鍵”となる3項目が表示されるというもの。それらの項目とは、「55%以上、ファーストサーブでポイントを獲得する」「相手のファーストサーブで、36%以上ポイントを獲得する」など、相当に詳細な条件だ。そしてひとたび試合が始まれば、セットごとに、それらの条件をクリアできているか否かが表示される。
これら、“KEYS”となる条件を、IBMはいかにして弾き出しているのだろうか……?
取材に対し、USオープンに常駐するIBMスタッツチームは、以下のことを教えてくれた。
まずはIBMは、30年の長きに渡りUSオープンと提携しており、その間に蓄積した膨大なデータがあること。以前はそれらのデータは主審から提供されるものであり、項目も“ファーストサーブの確率”や“ウイナー/エラーの数”などに限られた。それが2006年に、コンピュータ動画処理システム“ホーク・アイ”が採用されてからは、より詳細なデータ収集・解析が可能になる。さらに近年では、ホーク・アイが設置されていないコートの試合動画をも用いて、一層豊富な情報を母集団としているという。
ただし、KEYSを弾き出すのに用いるデータは、基本過去8年以内。それで足りない場合は12年まで拡張するが、それより以前のデータは使っていないという。あまりに古いデータは、むしろノイズになるからだ。
そして勘所は、KEYSを決めるにあたり、どの試合データを使っているのか……である。“勝利への鍵”である以上、それは対戦する相手によって左右される部分もあるからだ。
そこに関してIBMは、「基本は、両選手の過去の対戦を母集団とします」という。ただ、ロジャー・フェデラーとラファエル・ナダルのように40回対戦している選手どうしならよいが、当然ながら、ほとんどのケースはそうではない。初対戦の顔合わせだってある。
そのような時には、「似たプレーヤーとの対戦データを参照します」とIBMは説明した。
「ベースラインからの打ち合いを得意とするストローカーなのか、あるいはネットプレーも多様する速攻型なのか、サーブが強いタイプか否か……そのような条件から類推し、有益と思われる試合のデータを使うようにしています」。
またデータ分析の際には、擬似相関(spurious correlation)を除去する配慮もなされているという。
擬似相関とは、例えば「フェデラーがナダルに勝つ時は、フェデラーのエラーが多い 」というデータがあるとする。ただこれは、エラーが多いのはウイナーを取るためにリスクの高いプレイを選んでいるためであり、真の因果関係は、ウイナー数と勝利にある……というような状況だ。つまり、エラーの数と勝利には、表層的な相関関係があるだけ。このような疑似相関を消すためにも、「似たプレースタイルとの対戦成績」を含めた母集団を増やすことが重要であるという。
そのようにして算出された“KEYS”は、果たしてどれほどの予測の確度を誇るのか――?
今後グランドスラムでの試合を、そのような視点で見てみるのも、また楽しいかもしれない。
※次回は、IBMが誇るIA(人工知能)“ワトソン”が編集・制作する“試合ハイライト”についてお伝えします!