「Hey Siri」や「OK,Google」はもう超えた!? スマホで「ChatGPT」や「Copilot」をボイスアシスタント風にAIチャットを活用してみた
2024年、デジタル業界最大のテーマはAI(人工知能)。「ChatGPTなら、昨年から触っているよ」という人も多いかもしれません。そんなAIも最近はスマホへの進出を進めています。 【それぞれの検索結果を見る】 OpenAIによるChatGPTは昨年5月からiOSアプリ版が登場していて(Android版は7月)、11月には無償版のユーザーも含めて音声認識に対応。マイクロソフトが展開しているAI機能のCopilotも、昨年12月にアプリ版が登場。ちなみに、マイクロソフトのブラウザ「Edge」のアプリ版にもCopilotが一体化して利用可能で、こちらも音声認識に対応しています。 普段はChatGPTもCopilot(Edge)も大活用しているのですが、今回のテーマは「"Hey Siri"のSiriや"OK,Google"のGoogleアシスタントの代わりに、AIチャットを使えないか」ということ。今のChatGPT(有料版のGPT-4)やCopilot(中身はGPT-4、無料)の方が、音声アシスタントよりも賢く答えてくれますからね。 現時点ではスマホアプリ版のChatGPTもCopilotも、ウェイクワードには対応していません。でも、スマホは機種によっては自分で指定したアプリを端末のボタンから直接起動できるので、起動してしまえば、後は音声認識で質問を入力できます。 例えばiPhone 15 Pro/Pro Maxならアクションボタンから指定のアプリを起動可能。Androidスマホもショーカット登録ができる機種があります これなら、外出先で“ちょっと検索したい”という時に、ワイヤレスイヤホンから音声で話しかけられ、より便利に使えるようになるのでは? 実際に検証してみました。
■OpenAI純正のChatGPTとブラウザ「Edge」のCopilotでテスト
まずは利用するAIアプリの準備から。 今回、僕が利用するのは、OpenAI純正のChatGPTアプリと、ブラウザ「Edge」のアプリ版に搭載されているCopilotです。 iPhone 15 Proのアクションボタンを利用する場合にはChatGPTは“Start voice conversation”(音声によるやり取りの開始)を直接呼び出せるので、呼び出し部分にはさほど不自由はなし。ただし、音声認識可能になるまでに2~3秒のラグがあります。 ChatGPTを使ってみて気になったところは、音声で話しかけてから反応まで30秒以上と遅い点。回答音声は外国人風日本語で返してくれますが、音声回答中に画面表示がない点も残念。スマホを手に持っていることも多いので、どうせなら文字情報も出してほしいですね。また時々、いきなり英語で答えだすことがあるので、日本語でお願いしますと頼みましょう。 マイクロソフトのCopilotは、ふたつの使い方があります。アプリ版のCopilotはBluetoothで接続済みのワイヤレスイヤホンを無視して本体スピーカーで応答します。ブラウザ「Edge」内蔵のCopilotはワイヤレスイヤホンからの呼びかけで応答してくれるので、屋外利用では「Edge」のアプリ内Copilotを使う他ありませんね。 Edgeで活用する際には、アプリを起動後、画面下のCopilotボタンを押して、さらに音声認識ボタンを押す操作が必要。ただ、スマホを手に持っていれば操作は難しくありません。音声認識開始も早く1秒以下ですね。レスポンスは10秒以上かかるので決して早くはありません。 今回は外出先で使うシチェーションなので、Siriで同じことを尋ねた結果も比べてみました。なお、レスポンスは“Hey Siri”で呼び出せるSiriがぶっちぎりで優秀です。