「リソースの課題を技術で解決」――災害時にラジオを放送し続けるために、AIアナ開発秘話
AIやロボットによって、今後20年ほどで、今ある職業のおよそ半数が奪われてしまう、という英オックスフォード大の予測があります。人間の仕事が失われるということは悲観的に捉えられがちですが、技術革新とともに迎える未来は本当に暗いものなのでしょうか。人間にはない、テクノロジーの力を活用すれば、私たちが抱える問題が解消されるかもしれません。
その可能性を信じてAIの活用に挑戦しているのが、和歌山県和歌山市にあるコミュニティFM局「エフエム和歌山」です。2008年に開局し、約50万人の聴取可能人口に向けて地元のニュースやオリジナル番組を放送しています。
同局のクロスメディア局長・山口誠二さんは2017年7月、アマゾンウェブサービス(AWS)の人工知能サービス「Amazon Polly(アマゾンポリー)」を活用して放送を行う仕組みを開発。AIアナウンサーの誕生として、大きな話題を呼びました。開発に至った経緯や、ニュースの自動読み上げシステムのメリットについて伺いました。
取材・文/万谷絵美
編集/ノオト
AIアナウンサーの裏側で動く、2つのソフトウエア
――AIアナウンサーって未来の響きがします。多くのメディアから注目されているようですが、いったいどのような仕組みなんですか?
アマゾンウェブサービスジャパンが2017年8月に実施した、機械学習サービスについての記者説明会で、「Amazon Polly」の導入事例として紹介してくれたこともあり、いろいろなメディアで取り上げられました。「AIアナウンサー」と一言で表現されますが、実はこの裏側では独自開発した2つのソフトウエアが動いています。
<山口誠二さんのプロフィール>
1982年生まれ。東京で3年ほどPHPやJavaScriptを用いたウェブエンジニアとして活動後、 2008年にNPO法人「エフエム和歌山」の開局と同時に入社。 ウェブシステムを用いて、放送局用のさまざまなシステムやアプリを構築している
1つは、ニュースや天気予報、音楽を取得して、設定した時間通りに流す「OnTimePlayer(オンタイムプレイヤー)」です。こちらは通常放送時に使うシステムで、タイマー設定しておけば、定時に音声読み上げによる自動放送が可能です。ニュースや天気予報の情報は、読売新聞社からメールで配信されてきたニュースをプログラムで原稿化し、「Amazon Polly」で音声に変換します。
そして、もう1つが災害時でも24時間連続再生できる「Da Capo(ダカーポ)」。設定した原稿を音声で配信し、終わると音楽が1曲流れます。その1セットがリピート放送される仕組みで、テキストを変更すれば新しい情報がまたリピートされます。また、国内に滞在する外国人向けに、自動翻訳機能を使ったバイリンガル放送にも対応しています。
この2つのシステムとパソコン、インターネットという環境がそろえば、どこからでも生放送が可能です。たとえ局内が無人であっても、安定した放送ができるようになりました。ただし、AIや人工知能と聞くと、パソコンが自分で勝手に考えて放送しているように思いがちですが、AIアナウンサーの仕組みはそうではありません。文章を音声に変換して読み上げるのがAI技術であり、その裏では、誰かが原稿を書いたり放送時間の設定をしたりしているのです。
――今回のシステムに「Amazon Polly」を選んだ理由は?
実は、音声合成技術の歴史は結構古く、これまでもいろいろなところで活用されています。ボーカロイドの「初音ミク」が有名ですね。その中でなぜ「Amazon Polly」だったかというと、1つは従来のソフトウエアと違い、イントネーションや間の取り方、漢字の読み方を「Amazon Polly」が独自に学習していってくれるから。
「Amazon Polly」を使い始めてまだ半年ほどですが、すでにかなり学習が進んでいるなと感じることもあります。たとえば、句読点を原稿に入れていないのに、勝手に句読点があるような感じで読んでくれるようになりました。間の取り方を自分で考えているということですよね。
Amazon以外にもこのようなサービスはありますが、読み上げ音声が人の声に一番近いと感じたのも一因です。人間に近い音声にするために、ユーザー側で調整する必要がありません。
もう1つの理由に、どんな小規模の局でも使える、圧倒的な利用料の安さがあります。他のソフトウエアを使ってみようと見積もりを取り寄せたこともあるのですが、初期導入だけで数十万円、さらに月々数万円の費用がかかるということで、断念せざるを得ませんでした。「Amazon Polly」であれば、読み上げ100万文字当たりにかかる費用は4ドル(約450円)。私たちが1年間運用しても、400円ほどと算出できました。実際に放送をスタートしてみると、文字数が見積もりより少なく、もっと安く済む予想です。
災害時にその力を発揮する自動音声放送
――当初から、災害時の対応まで考えて開発されていたのですか?
そうですね。この開発のきっかけは、東日本大震災で臨時災害放送局に指定された現場を視察にいき、その場で感じた問題を解決したいと思ったことです。通常放送で使っているのは、災害時にきちんと動かすためのテスト運用なんです。
自動音声での放送が最も力を発揮するのが災害時。もし大規模災害が起これば、コミュニティFMは、地域住民のために、長期間にわたって災害に関する情報や地域の生活情報を発信し続けることになるでしょう。けれど、アナウンサーを確保できない可能性もある。そんなときに自動音声による放送ができれば、たとえ原稿を読める人がいなくても、徹夜で放送し続けられます。
――現状、災害後のラジオ局では、どのようなことが放送の障壁となっていますか?
長期間の災害報道では、アナウンサーの確保以外に、スタッフの体力がどれくらい持つのか、原稿を印刷するトナーなど物資がいつまで持つかといったことも問題になります。東日本大震災のときに、エフエム世田谷では、アナウンサーさんが家に帰らず、3日間放送し続けたと聞きました。当時はエフエム和歌山でも、たまたま局内にいた2人のパーソナリティーと臨時放送を続けました。はっきり言って、数時間で「もう無理だ」と思うくらい疲れます。非常時は音楽をかける雰囲気ではなく、とにかくしゃべり続けることしかできません。そうなると全員が疲弊し、長期間の放送に耐えられないのです。
こうした人や物資の問題が解消できれば、災害時に伝えられる情報量は圧倒的に増えます。激甚災害が起こったときでも、ラジオが安定した放送を行うとリスナーが知っていれば、確実にラジオをつけてもらえる。最新の地域情報をより多くの人に届けやすくなるでしょう。AIアナウンサーは、単純にアナウンサー不足や資金不足を解消するだけでなく、多くの命を救う可能性を持っているものなのです。
通常番組を休止しても、リスナーから高評価を受けた理由
――導入から半年がたちました。その成果はいかがですか。
合成した女性の声には「ナナコ」、男性には「八太郎(はちたろう)」と名づけ、通常放送の中でニュースや天気予報を読み上げさせています。緊急情報に対する運用実績は、2017年秋に台風が来たときの3回。台風は毎年何度もやってくるので、都度対応すると、人的リソースがかかりすぎる。ほとんどのラジオ局では通常の番組を止めてまで臨時放送などしないのが現状ですが、この仕組みによってディレクター1人で放送対応できました。だから「台風情報に切り替えよう」と思い切れたところもあります。
このときのタスクとしては、まず気象庁のウェブサイトで気象情報を確認します。さらに、FAXで届く電車の遅延や渋滞などの交通情報、停電が発生したときは関西電力の停電地区と軒数を確認。それらを原稿にまとめます。避難勧告が出た際は、どの地域が対象か、避難場所はどこか、そこに今何人が避難しているのかまで調べて放送しました。あとは、アップデートされた情報がないか追って、原稿の更新も。津波や地震のときは1人だと難しいかもしれませんが、台風の情報収集は毎年のことで慣れているので問題ありませんでしたね。
――情報収集は人の手で行うのですね。
よく聞かれるのですが、最初からそもそもそこを自動化しようと思っていませんでした。放送の現場にいるとわかりますが、緊急時は情報が錯綜(さくそう)していることも多く、どこから引っ張ってきた情報が正しいか、機械的に判断するのが難しいんです。結局、いくつもの情報源から照合したり、電話で問い合わせたりしなければ、正しい情報発信はできません。いまだにFAXで届くものもありますし、市町村がホームページに出している情報だって、間違っていることがありますからね。
機械による読み上げなら、読み間違いは起こりません。しかし、もし誤った情報を流してしまったら、それによって誰かの命を奪うことになるかもしれない。なので、情報収集は安易に機械化するところではありません。人間がやるべきこと・やらなくていいことを区別し、技術を使ったほうが良い結果が出るところを、全面的にシステムに任せるというスタンスが大切だと思います。
――リスナーからの反響はいかがでしたか?
いつもの番組をやめて機械音声が延々としゃべり続けることに対して、リスナーからお叱りを受けるかと思っていましたが、実際にはそういった批判は一切なく。「ずっと聞いていた」「すごくよかった」というお褒めの言葉をたくさんいただきました。聴取エリア外からもネット経由でずっと聞いていたとのメールもありましたので、今後は和歌山県全域に対応した情報を出そうと思っています。他の放送局ができないのであれば私たちがやればいいんだと思うようになりましたね。
――ほかのラジオ局から何か反応はありましたか?
全国のコミュニティFM局から「うちでも使いたい」とたくさん問い合わせをいただいています。今後みなさんに使ってもらえるよう、システムをクラウドですべて完結するよう整えたところです。利用者IDを振っていけば、他の局でも同じ放送システムが利用可能です。英語にも対応しているので、国内だけでなく発展途上国といった、自前で放送をするのが大変な地域でも使ってもらえたらと思っています。
このシステムによって、ラジオは新しい道へ一歩踏み出せるのではないかと思っています。災害時に必ず最新情報を連続で放送しているとなれば、誰しもが「とりあえず、ラジオつけよう」となります。テレビのように常に情報を文字で出しておけなくても、連続リピート放送ができればいつラジオのスイッチを入れてもらってもいいわけです。「次に情報をお届けするのは○○時です」という待ち時間がなくなります。
「日々の問題解決のためのプログラミング」が流行してほしい
――プログラマーでありラジオ局員である山口さんだからこそ、この仕組みが作れたように思います。
そう言ってもらえるとうれしいですね。ウェブ開発者として仕事をしてきたことと、ディレクターとしてラジオ局の現場で職員として働いたこと。2つのキャリアが結びつきました。
プログラミングというと難しそうですが、今はいろいろなソフトウエアの機能が外部からでも使えるAPI【※】というものがあり、一からすべて自力で開発しなくていい。世界中のプログラマーが作って公開してくれている機能をつなぎ合わせ、自分に便利なサービスを作れる時代です。今回開発したAIアナウンサーのシステムにも、APIをたくさん活用しています。
※アプリケーションプログラミングインターフェース。異なるソフトウエア同士でデータをやりとりできる機能のこと
――今後はどのような展開をイメージされていますか。
この仕組みを多くのラジオ局で使ってもらい、リソースがなくても緊急時の放送をしてもらえたらということがまず1つ。そして、もう1つは今回のことを事例として、人出不足で悩む現場にいる人たちみんなが、それぞれの立場でプログラミングの技術を使い、課題解決をしてくれたらと思っています。たくさんのサービス開発が進めば、それはとても大きなイノベーションになるのではないかと期待しています。
職業としてプログラマーやSEを選んだからではなく、自分がいる場所をより快適にするためにプログラミングをする。そんな社会になっていったらいいですよね。
お問い合わせ先
このブログに関するお問い合わせについてはこちらへお願いいたします。