OpenAIがドイツの技術イベントで語った「生成AIの次」に起きること。加速する4つの変化とは
「この1年で、この業界は大きく変わりました」 生成AIブームの火付け役とも言える米OpenAIでチーフアーキテクトを務めるコリン・ジャーヴィス氏は力強くこう語る。 【全画像をみる】OpenAIがドイツの技術イベントで語った「生成AIの次」に起きること。加速する4つの変化とは OpenAIが開発するChatGPTや、グーグルのGemini、マイクロソフトのCopilotをはじめ、各社が生成AIの開発にしのぎを削っている。6月上旬、ドイツ・ベルリンで開催された欧州最大のテックカンファレンス「Tech Open Air(TOA)」に登壇したコリン氏は、世界で盛り上がりを見せる生成AIの「今後」起きうる展開について言及した。 あくまでも「推測」であると前置きした上で、「テキストモデルのさらなる進化」「安価かつ高速化」「カスタマイズ性の増加」「モダリティの増加」の4つが進んでいくのではないかと語った。
生成AI「次」に起きること
「テキストモデルの進化」は、この1年半の間に生成AI業界で起きていたことの「続き」だと考えると納得しやすい。 2022年12月にChatGPTが登場して以来、多くの民間企業の参入によってテキストモデルは競い合うように進化してきた。コリン氏は、この状況はさらに加速、継続していくはずだと指摘する。 「どこかがトップに立つたびに、1カ月程度で他のプレイヤーが追い抜いていく。これらのテキストモデルは、今後もますますインテリジェントになっていきます」(コリン氏) モデルが発展していけばいくほど、計算コストも増え、価格も上がっていくようにも思える。ただ、コリン氏は「ますますモデルが強力になっているにもかかわらず、より安価で高速になっている」と現状を指摘する。実際、OpenAIが提供してきたモデルのコストを比較すると、GPT-4も提供開始時からコストが約70%ほど減っている状況だという。 「モデルがより賢くなり、より安くなっているのであれば、今はうまくいかないことでも、3カ月後には実現可能になっているかもしれません。そういった進歩が今後も続くことを期待しています」(コリン氏) 加えてコリン氏が指摘するのは、よりカスタム性の高い生成AIの登場だ。 現状、多くのユーザーが使用する生成AIは、各社が提供しているいわゆる「基盤モデル(Foundation Model)」だ。コリン氏は、基盤モデルに微調整を加えたり、ユーザーが独自のデータを加えたりすることはできるものの、汎用性の高い基盤モデルには限界があると話す。その上で、基盤モデルを構成するより「前段階」から、特定のサービスに特化(カスタマイズ)した生成AIを構成するような動きが起きるのではないかと指摘した。 加えて、GPT-4で進んだマルチモーダル化※ もさらに加速していくのではないかと指摘する。 ※マルチモーダル:テキスト、画像、音声、動画など複数の情報を組み合わせて処理すること すでにテキストからコードや画像への変換や、画像とテキストを組み合わせて特定の動画を分析するようなAIは実現されている。ただし、こういったモダリティの移行にはAIのハルシネーションが伴うこともあるとという。コリン氏はこの壁を超えるAIがスタンダードになっていくのではないかと指摘しているわけだ。 「GPT-4やGemini 1.5 Proのように、1つのモデルで複数のモダリティ(テキストや音声など)を取り込んで、別の複数のモダリティで返すことができるようになればいいと思います。絵を描いたり、文章を書いたり、話したり……人と接するように、モデルと接することができるようになる。そういったユーザー・エクスペリエンスを構築することが、より現実的になっていくと思います」(コリン氏)
三ツ村 崇志