新聞とAIをつなげた「日曜プログラマー」――高校野球戦評を自動生成する仕組みを開発
神戸新聞社記者による高校野球取材風景(提供/神戸新聞社)
兵庫県の地元紙として、愛されてきた神戸新聞社。創刊120周年を迎えた同社はこの夏、AIを活用して高校野球(東・西兵庫大会)の試合戦評を自動生成し、Twitterで配信する取り組みを始めました。
その名も「経過戦評ロボットくん」。球場で集めたデータを読み込むと、あっという間に試合の流れがわかる原稿がリアルタイムで出来上がります。
このAIを開発したのは「日曜プログラマー」を自称する社員。雑談をきっかけに業務外で始めた作業が、注目を集める情報配信につながりました。なぜ地方の新聞社がAIに取り組んだのか? 企画総務局教育ICT室の武藤邦生さんと、デジタル事業局メディアプロモート室の川上隆宏さんに聞きました。
取材・文/万谷絵美
編集/ノオト
社内のノンプログラマーが業務外で開発をスタート
【ロボットくん】報徳対市尼崎は2-0で報徳が勝ち、甲子園出場を決めた。報徳は5回、一死満塁から3番長尾亮弥のファーストゴロファーストエラーで2点を先制し、この得点を守り切った。(続) pic.twitter.com/I3roT0N6Ui
— 経過戦評ロボットくん【高校野球・兵庫大会】 (@koya_robot_kun) 2018年7月28日
――どうしてAIを活用して原稿を自動生成しようとなったのでしょうか。「高校野球」をテーマに取り組んだ理由も気になります。
川上 弊社が運営するウェブサイト「神戸新聞NEXT」(以下、NEXT)では、高校野球コンテンツの人気が高く、これまでも全試合イニング速報を行ってきたほか、一部の記事や選手名鑑などは有料コンテンツとして提供してきました。
より使いやすいサイトを目指して、この春に高校野球ページのリニューアルをしたのですが、その際に目玉となる有料コンテンツとして「一打席速報」を追加しました。球場にいるデータ入力者が「4番 富永 レフト二塁打 二死 二塁」のように一打席ごとの詳細な結果を打ち込んで、試合の流れをリアルタイムで配信していく取り組みです。
ニーズは高いと予想されていましたが、取材現場の運用の負担も大きく、始めるにあたりもっと注目を集めたいという思いがありました。そこでNEXTの編集部長が「このコンテンツを活用して、何か面白いことができないか」と記者経験もある武藤に相談したことが始まりです。
武藤 相談といっても飲みの席での雑談のような感じでした(笑)。私はプログラマーではないですが、その方面に少し興味があったので「記事の自動作成ならできそうですね」と提案しました。そしてできる範囲から業務外で作業を始めました。言ってみれば「日曜プログラマー」です。
デジタル事業局の川上さん(左)と、「ロボットくん」開発者の武藤さん
――社内開発だったことに驚きました。
武藤 もちろん完全にプロのようにはいかないので、見る人が見ればたどたどしいコードだと思います。でも数万円で買ったパソコンでも動くような軽いプログラムなので、環境的に難しくはありませんでした。わからないことはネットで検索して調べながら作りましたよ。
「こういうものを作れ」と言われたわけではなく、システマチックで詳細なデータがあるから活用しようというところから始まっているので、スムーズに実現したのかもしれません。自分たちができる範囲内で企画しましたからね。
――プログラムとしては、どのような仕組みなのでしょうか。
武藤 文章を生成する仕組みは、それほど複雑なものではありません。まず「一打席速報」で使われる言葉の中から、試合の状況を伝えるために必要な情報の優先順位をつけ、そこから正しい文章を作れるようにしただけです。
優先順位のつけ方について詳しく説明すると、先ほどの例で言えば「一死満塁から3番長尾亮弥のファーストゴロファーストエラーで2点を先制」が具体的に得点に絡む言葉ですよね。この言葉を抜き出せるように、試合影響度の点数表を作り、AIに学習させました。例えば、数字が大きい得点シーン=試合への影響度が高いと判断させ、シーンを組み合わせていきます。プログラムには約12個のパラメータがあるので、そこから分析・算出しています。
試合後、自動的につくられた原稿がパソコンの画面に出てきます。一応、担当者がチェックしてTwitterに投稿しているのですが、出てきた文章は全く編集していません。今年は14試合で「ロボットくん」による戦評を出しましたが、どの試合後も大きなエラーのない文章を作ってくれましたね。
試合が終了すると「経過戦評ロボットくん」が作った文章が自動で表示される
――なるほど、高価なシステムを外注してつくったわけではなかったのですね。では、この開発の中で特に難しかったところはどこでしょう。
武藤 点数表の決め方ですね。「たくさん点が入った=重要なシーン」と単純に判断できるものでもないんですよね。戦評を読む側としては、どんな展開で勝敗が決まったのかが知りたい。なので、例えば打線がつながって5点が入った6回表よりも、サヨナラで2点が入った9回裏のほうが重要じゃないですか。ですから、どのシーンが試合に影響度が高く、戦評に抜き出すべきところなのか、重み付けの基準を決めるのに苦労しました。テストで作った文章をスポーツ記者に読んでもらったら「違和感がある」と言われてしまい、どうしたらいいのか頭をひねりました。
結果として、新聞社ならではの重み付けとしてこれまでに記者が書いた過去記事を学習させることにしました。試合を見た記者が記事にしたシーンは、試合展開の中で最も重要だったところですよね。AIに「このシーンは記事になった=とても重要なんだよ」と学ばせるのです。そうすることでより記者が書く文章に近づきますから、読み手に自然と受け入れてもらえると思いました。
社内の柔軟な判断で、日の目をみた「ロボットくん」
――実際に配信して、社内やTwitterユーザーからの反応はいかがでしたか。
川上 幸いにも、全試合で自然な文章ができましたので、お叱りをいただくことはありませんでした。違和感なく読んでもらえたのかもしれませんね。ただ、あまりに違和感のない内容すぎて、突っ込まれなかったというか、面白がってもらえなかったかもしれません。また、リリースを出したのが7月20日、運用開始が23日、配信終了が28日とかなり短い期間での運用だったこと、そしてツイートのインプレッションは相当数あったのですが、主に神戸新聞公式アカウントなどのリツイート先で閲覧されたこともあり、ロボットくんのTwitter自体のフォロワー数はそれほど伸びませんでした。今後取り組む場合は、もっと多くの方に関心を持ってもらえるようにしたいです。
ほかにも、社内からは運用前に「どんな内容になるかわからないような、自動生成された記事を外部に配信するのは不安だ」という声もありました。そのため、何かトラブルがあっても新聞社が発信する情報の信頼感を損ねないように、いろいろと見せ方を工夫しました。「ロボットくん」という名前を付けて、ゆるキャラのようなデザインにしたのも、あくまでプログラムが生成したコンテンツで、記者が書いたものではないとはっきり区別してもらうため。そして、発信場所を新聞社のサイトではなく、Twitterに限定したのも、実験的な試みであることを強調したかったためです。
もし変な文章が出てしまっても、「ロボットくんが壊れてしまった」という形でそのまま配信しようと決めていました。そのようなときこそ、ユーザーのみなさんにやさしく受け止めてもらえるように、壊れたとき用のアニメーションも作っていたんですよ。今回は残念ながら使わずに済みましたが……(笑)。
用意していた「ロボットくんが壊れてしまった」時の画像
もう一つ、有料会員向けコンテンツである「一打席速報」をベースに生成した情報を、無料で外部のSNSに配信する点も懸念事項となりました。しかし、「弊社を知らない新しい層にリーチできるかもしれない」「記者による戦評が出る前の、ちょっとしたお楽しみ情報」と意味付けることで、社内の了解を得ました。
――歴史ある新聞社の対応としては、とても柔軟だという印象があります。
川上 社内のノンプログラマーがつくったものを会社のオフィシャルな取り組みとして活用できたのは、会社の風土が関係しているかもしれませんね。弊社では、記者であれば業務に関わりなく特定のテーマを追い続けている者など、いろいろな活動をしている人が多く、それぞれの知識や経験を持ち寄ることがそれほど珍しくないかもしれません。「面白いからやってみようよ」と背中を押してもらえたのは、ありがたかったですね。
地域密着型の新聞とAIで新しい形の情報発信を
――AIによってそれだけ自然な文章をつくることができたとなると、社内からもっとAIを活用して効率化してはとの声が上がりそうです。
武藤 そもそも球場で「一打席速報」を発信する人がいなければ、解析するデータがなくて「ロボットくん」の仕組みは成り立ちません。また取り組みを通じて、AIで作ったテキストと記者の書いた文書との違いも実感しました。プログラムは事実を淡々とまとめているだけなので、やはり読んだときに感じる「熱量」が違います。ですので、現時点ではAIにどんどん置き換えて、記者は少なくていいといった考えに至ることはないと思います。
ただ、正確なデータを定期的に発信できる状況とAIを組み合わせれば、データの中で重要なことは何かをわかりやすくまとめたり、記事にできたりするのはわかったので、これまで環境が整わず見送っていた情報を記事化するという発想は生まれてくるかもしれません。
野球ひとつとっても、記者が出向けないような大会や試合が地域にはいっぱいあります。地元の方が発信した試合のデータを読み取って記事のかたちでまとめ、弊社サイトなどで広く紹介していくことも検討できるかもしれません。
川上 一般の方々から見れば、新聞は昔ながらのメディアですし、特に地方にある新聞社であれば、AIのような新しい技術とは縁遠い存在と思われているかもしれません。しかし、今回のような取り組みを通じて、まだまだ面白いことができる可能性があるのだと、感じてもらえたらうれしいです。
地域に密着した新聞をつくっているといいながら、これまでの新聞のあり方ではカバーできていない、伝えきれていない情報、伝えなければならない情報がまだまだたくさんあるのではないかと思います。取り組める範囲はまだまだ小さいですが、技術をうまく活用することで可能になる情報発信のあり方を、模索していきたいと思います。
お問い合わせ先
このブログに関するお問い合わせについてはこちらへお願いいたします。