「喋るだけで各種操作できる」人工知能搭載のスマートスピーカーが見せる未来像

山本一郎です。以前から噂されていたAmazonのディスプレイ搭載型スマートスピーカーが、きのう正式発表されました。

Amazon、7インチタッチスクリーン付き「Echo Show」を230ドルで発売へ(ITmedia 17/5/9)

価格は229.99ドルと、同社既存製品に比べて一見割高な設定ですが、カラーディスプレイが付いて音声/ビデオ通話も可能ということですから、家族で共用できる据え置き型のスマホという体でとらえれば、そこそこ安価な製品と考えることもできそうです。どういう使い方ができるかを具体的に示すデモ動画も公開されており、本当にこうした用途で実用に耐えるものであれば、欲しいと考える人も少なくないのではないかと思いました。

Introducing Echo Show(YouTube)

これまではSFの中にしかあり得なかったような人工知能付きテレビ電話的な存在が完全に現実のものとして登場してきた印象ですね。こうしたデモ動画はあらかじめ決められた台本があるわけですが、気まぐれな日常生活の中でも同じようにスムーズに機能するのであればそれなりに重宝しそうです。

音声認識で動作する据え置き型スマートスピーカーというジャンルは、少なくとも米国市場においては、飛び道具・オモチャ的なポジションからもう少し実用的な家電的ポジションへと変わりつつある勢いがあるようで、Microsoftもいよいよ市場参入するという報が入ってきております。

AI搭載スピーカー、マイクロソフトが参入(日本経済新聞 17/5/11)

米マイクロソフトは人工知能(AI)を搭載した「スマートスピーカー」市場に参入する。韓国サムスン電子傘下の音響機器大手ハーマンインターナショナルや米HP、米インテルと提携し、マイクロソフトの会話型AI「コルタナ」を搭載した製品を投入。急拡大する同市場で先行する米アマゾン・ドット・コムなどを追撃する。

出典:日本経済新聞

マイクロソフト 人工知能搭載のスピーカー公開(NHKニュース 17/5/11)

人工知能を搭載した小型スピーカーの市場は、2014年に製品を発売したアマゾン・ドット・コムが先行し、これまでにアメリカでおよそ800万台を販売したと見られています。

去年11月にはグーグルも参入し、アメリカの調査会社によりますと、2020年の世界の市場規模は今の6倍のおよそ2400億円に拡大するという試算もあります。

出典:NHKニュース

そうですか。

どうしても日本国内からは米国スマートスピーカー市場の熱量みたいなものを想像するのはむつかしいのですが、数年前にバブルな様相を呈していたスマートウォッチよりは着実に消費者の心をつかみ普及していきそうな空気を感じます。先のAmazonのデモ動画を見てもそうなんですが、老若男女問わず普通の人の生活に無理なく馴染んでいけそうな気配があるといいますか、逆にいうとスマートウォッチで提唱されていた利用想定はあまり普通の人の生活感とマッチしていなかったということなのかもしれません。

IT業界全体としてはスマホの次に来るのは何かということがそろそろ議論されだしています。

スマートフォンの終焉が近づいている--次の大きな波は何か(CNET Japan 17/5/9)

スマートフォンのイノベーションは、ゆっくりと止まろうとしている。端末に詰め込める機能はもうあまりなく、今ではディスプレイにカーブを付けることが最先端技術と言われるようになってしまった。巧みな機能が過剰に搭載されており、ほとんどの人はその存在に気付きもせず、一度も使うことなく終わってしまう。多くの国で市場は飽和状態にある。

(中略)

では、次に来るものは何なのだろうか。

出典:CNET Japan

上記の記事では、次に来る有力候補として「拡張現実(AR)と仮想現実(VR)」があげられています。なるほど、その可能性はそれなりにありそうです。しかし、AR/VRを実用レベルにもってくるためにはまだハード/ソフト共に課題が多いのも現実でして、そういう時代が来る前にもしかしたらスマホの後を引き継ぐものとしてスマートスピーカー的なものが台頭し大きな役割を担う可能性があるかもしれないなとぼんやり考えたりします。まあ、スマートスピーカーは“モバイル”という現代においてかなり重要な要素が欠落しているのでそこは差し引かなければならないのですが、米国だけの事情で考えれば自動車という動く部屋の中でスマートスピーカーを利用できるという答えもあり得るので、何か独自の進化が発生する可能性はありそうです。

それにしても、スマートスピーカーは言葉の壁が大きく、米国でいくら急速に進化したとしてもそれをそのまま日本へ持ってくることは容易ではありません。スマホのときと同じぐらいの時差程度で導入することはほぼ不可能でしょう。逆にいえば、ガラケー時代に日本独自のiモードが生まれ独自のエコシステムが生まれ繁栄したのと同じようなガラパゴスな展開こそが正解という可能性もありそうです。うまくすればこれから10年くらいのスパンで日本経済を牛耳ることもできそうですから、既にそこを狙って動いている企業も少なくないと感じます。

LINEも音声認識アシスタント市場へ参入だそうで(Yahoo!ニュース 個人 山本一郎 17/3/2)

もうかなり昔ですが「リビングにインターネットを」というコンセプトで、テレビにネットを繋ぐ、あるいはネットにテレビが繋がる系の話は随所にありました。もちろん、これらのスマート家電的なものは消費者の支持を得ることなく全滅したわけですけれども、そこに新しいユーザー体験・ユーザーインターフェイス(UX/UI)としてAI・人工知能が来ることで違う未来が見えるのだとしたら、AR/VRももう少し普及の道筋が見えやすくなるのでしょうか。