生成AI統合で新アレクサ誕生か 会話の文脈を読み取りタスクを実行へ
アマゾン、アレクサをジェネレーティブAIで大幅アップグレード
現在、ウェブやスマートフォンでの利用が圧倒的に多いジェネレーティブAIチャットツールであるが、今後はスマートホームデバイスなどを介した利用も増える可能性が高まっている。 スマートスピーカー市場で最大シェアを占めるアマゾンもこの動きに備え、ジェネレーティブAIを活用してアレクサを強化する方針だ。 同社は、2023年9月20日に開催した秋のイベントで、大規模言語モデルを活用し、アレクサの会話能力をアップグレードする計画を明らかにした。 このイベントでは、アマゾンのデバイス部門責任者であるデイブ・リンプ氏が登壇、新アレクサは会話の文脈を理解し、適切な応答が可能となり、1回の指示で複数のリクエストを実行することも可能になると説明した。 リンプ氏は、イベント前に米The Vergeのインタビューに応じ、アレクサの大規模言語モデルは、アレクサ向けに最適化された真に汎用化した大規模言語モデルであり、グーグルのBardやOpenAIのChatGPTとは異なると指摘している。 ジェネレーティブAIが統合された新アレクサは、今後数カ月にわたり米国のみでプレビュー版として段階的に展開される予定だ。
新アレクサの能力
今回のジェネレーティブAIによるアップグレードで、アレクサの能力は大幅に高まることが期待される。これに伴い、今後もしかすると現在無料で利用できる同サービスが有料化される可能性もゼロではないという。 リンプ氏は、アレクサがスマートホームを強化し、より複雑なタスクを代行する超人的なアシスタントに進化すれば、将来的に何らかの料金を請求できるほどの実用性を有する存在になるかもしれないと述べているのだ。 以前のアレクサと新アレクサの大きな違いの1つは、会話を理解する能力にある。ジェネレーティブAIを活用することで、ユーザーの発言と文脈を理解し、具体的な名称を連呼しなくても、ユーザーが求めることを理解し、スムーズにアクションを実行することが可能となった。 スマートスピーカー利用におけるフラストレーション原因の1つとして挙げられるのが、要求するアクションをスマートスピーカーが理解できず、そのアクションを実行させるために、要求を何度も繰り返す必要があることだ。部屋の温度を変更するだけでも、その要求を何度も繰り返さなければならないシーンはよくあると報告されている。 一方、新アレクサは、「アレクサ、寒いです」というユーザーの発言に対し、その意図を理解し、部屋の温度を変更することが可能であるという。 新アレクサには、1回の指示で複数のタスクを実行できるマルチタスク能力も備わる。現時点でも「アレクサ、ライトを消して、ドアを施錠して」という基本的なマルチタスクをこなす能力があるとされるが、新アレクサはより複雑なマルチタスクを実行できる能力を持つようになる。リンプ氏は例として、「アレクサ、スプリンクラーを起動して、ガレージのドアを開けて、外のライトを消して」という複雑な指示にも対応できるようになると説明している。