グーグル、エージェント時代の次世代AIモデル「Gemini 2.0」を発表
Googleは米国時間12月11日、エージェントの時代の次世代AIモデルとして「Gemini 2.0」を発表した。また、コンピュータービジョンに基づくAIエージェント「Project Astra」のテスタープログラムを拡大することも明らかにした。 5月に開発者会議Google I/Oで発表されたProject Astraは、GoogleのAI研究における大きな進歩だ。スマートフォンやスマートグラスに搭載されたカメラを通して動作し、ユーザーの周囲の世界を認識・分析し、それに関する質問に回答できる。例えば、バスの行き先や本を置いた場所などだ。 Googleは、Astraの最新バージョンには、複数の言語および混合言語での会話能力、「Googleレンズ」や「Googleマップ」との連携、最大10分間の記憶保持、応答速度の向上が含まれるとしている。 一般公開の時期は明らかにされていない。 Project Astraの視覚的な機能は、プライバシーに関する懸念を引き起こす可能性が高い。Googleは、社内レビューグループであるResponsibility and Safety Committeeと協力し、潜在的なリスクを特定しているという。また、ユーザーが意図せずにエージェントに機密情報を共有することを防ぐための対策を検討中であり、ユーザーがセッションを簡単に削除できるようにするための制御をすでに組み込んでいる。 Gemini 2.0と「Project Mariner」 Googleによると、Gemini 2.0は一般的なクエリからコーディングの質問、さらには数学に至るまで、あらゆる分野でより優れた応答を可能にする高度な推論能力を備えるという。また、以前のバージョンよりも高速に動作する。Gemini 2.0 の最初のモデル「Gemini 2.0 Flash」は、一般公開に先駆けて開発者向けに提供されている。 また11日から、すべてのGeminiユーザーがデスクトップとモバイルのドロップダウンメニューから、Gemini 2.0 Flashの試験運用版にアクセスできるようになる。まもなくスマートフォンのGeminiアプリでも利用できるようになるという。Googleは2025年早々に、Gemini 2.0をより多くのGoogle製品に拡大するとしている。 Googleは、ブラウザーを使った複雑なタスクを支援するプロトタイプであるProject Marinerも発表した。試験運用版の「Chrome」拡張機能を介して、テキスト、画像、グラフなど、ピクセルやウェブ要素を含むブラウザー画面上の情報を分析し、その情報を使用して複雑なタスクを完了できる。Project Marinerはまだ初期段階で、精度や速度に課題があるという。この機能は一部のテスター向けに提供されている。 Googleのエンジニアは、AIがゲームを手助けする方法についても研究している。「クラッシュ・オブ・クラン」や「ブロスタ」の開発元であるSupercellと提携し、ボスを倒すために何をすべきかなど、プレイ中のゲームに関する質問に答えられるAIの開発に取り組んでいる。 同社はまた、コーディングを支援するAIエージェント「Jules」を開発中であることも発表した。JulesはGitHubのワークフローに統合されている。 この記事は海外Ziff Davis発の記事を朝日インタラクティブが日本向けに編集したものです。