Googleの最新型AI「Gemini 2.0」って何ができるの?
先日Googleは、同社のフラッグシップAIモデルの最新版「Gemini 2.0」を正式に発表しました。 具体的には「Gemini 1.5 Flash」の後継となる「Gemini 2.0 Flash」の試験運用版を展開しています。 GoogleのFlashモデルは、強力なAIモデルを必要としないタスクのために設計された軽量モデルであり、効率性をより重視しています。 それでもGoogleは「Gemini 2.0 Flash」は「Gemini 1.5 Flash」だけでなく「Gemini 1.5 Pro」のような強力なモデルへ改良すると説明しています。
「Gemini 2.0 Flash」をほかのモデルと比較すると?
Googleは「Gemini 2.0 Flash」について、General MMLU-Proのベンチマークを含む3つの異なるコーディングのベンチマーク、現実性テスト、2つの数学のベンチマーク、論理的思考、2つの画像のベンチマーク、動画のベンチマークなど、多くの分野で「1.5 Flash」と「1.5 Pro」のどちらにも勝っていると説明しています。 勝っている点では「1.5 Pro」のパフォーマンスに近いものがありましたが、Natural2Codeのベンチマークで7.5ポイント以上、HiddenMathのベンチマークで9ポイント以上など、大幅に改善されている点もありました。 音声のベンチマーク(40.1% vs 39.2%)や、長い文脈のベンチマーク(82.6% vs 69.2%)では、依然として「1.5 Pro」が「2.0 Flash」を上回っています。 このような改善点に加えて、「2.0 Flash」はAIが生成した画像とテキストや、テキストからおこした音声の合成など、新しいマルチモーダル出力にも対応しています。 さらに、Google検索を取り込んだり、コードを実行したり、ほかのサードパーティの機能も利用可能です。