オープンAIが「GPT-4o」発表 音声反応を高速化、会話の割り込みも可能
生成人工知能(AI)「チャットGPT」を手がける米オープンAIは5月13日、新たなAIモデル「GPT─4o」を発表した。人間相手のようなリアルな音声会話が可能になったほか、文字や画像を扱える機能を追加。AI分野でのリードを固めたい考えだ。新モデルは無料で提供され、有料サービスの利用者はより高度な機能が使えるという。 AIとリアルな会話ができる日も近い? 「君に紹介したいんだ」 「こんにちは、かわいいモフモフさん。あなたの名前は?」 「バウザーだよ」 チャットGPTを手がける米オープンAIは13日、新たなAIモデル「GPT-4o」を発表。人間相手のような会話が可能で、文字や画像も扱えるようになる。 新しい音声機能は人間と同じような反応速度を実現。チャットGPTが話している間に割り込むこともできる。いずれも、リアルな会話の特徴で、従来の生成AIチャットボットでは再現が難しかった。 OpenAIの研究者はライブストリームでGPT-4oを公開。 「今、ライブでデモをやっているが、少し緊張している。緊張を和らげてもらえないか」 「すごい、ライブでデモをやっているなんて。深呼吸して」 紙に書かれた数学の方程式を認識し、解く手順を音声で説明するデモも。 「OK、割り算だと思う。両辺を3で割ってみよう」 「ビンゴだ。両辺を3で割ってみて」 「チャットGPT、私の答えはこうだ。どうだろうか」 「完璧だ、解けた。x=1だ、よくできた。一次方程式を解いた気分は?」 オープンAIのムラティ最高技術責任者は新モデルを無料で提供すると述べた。有料サービスの利用者はより高度な機能が使える。 チャットGPTは2022年後半の公開後、史上最速で月間アクティブユーザー1億人を達成したが、利用者層拡大のための競争激化に直面している。