イライザが「日本語でGPT-4」超えのAIモデルを開発。KDDIとの提携で投資を加速
AIスタートアップELYZA(イライザ)は、日本語性能でOpenAIの「GPT-4」を上回るとする 新たな大規模言語モデル(LLM)「Llama-3-ELYZA-JP-70B」を開発したと6月26日に発表した。 【全画像をみる】イライザが「日本語でGPT-4」超えのAIモデルを開発。KDDIとの提携で投資を加速 「Llama-3-ELYZA-JP-70B」は700億パラメータを持つハイエンドモデルだが、同日には軽量版(80億パラメータモデル)「Llama-3-ELYZA-JP-8B」も発表している。 こちらはモデル自体を商用利用可能なオープンモデルとして公開している。
目的の違う2種類のモデルを発表
ELYZAが開発した「Llama-3-ELYZA-JP-70B」は、日本語のベンチマークテストである「ELYZA Tasks 100」では4.07点(5点満点)、「Japanese MT Bench」では9.075点(10点満点)を記録。これはGPT-4の4.03点と9.013点をそれぞれ上回る成績だ。 ELYZA代表の曽根岡侑也氏は「グローバルトップラインに立った水準を超えることができた」と述べ、日本語に特化したAIモデル開発の成果を強調した。 一方、軽量モデルの「Llama-3-ELYZA-JP-8B」は、「GPT-3.5 Turbo」に匹敵する性能を持ちながら、一般的なPCでも動作可能な軽さを実現しているという。 さらに、このモデルは商用利用可能なオープンモデルとして公開され、幅広い応用が期待されている。
オープンモデル採用で短期間に精度向上
ELYZAの開発手法は、オープンモデルとして公開されているLLMに対して、日本語に特化したチューニングをして精度を高めている。 曽根岡氏は自社の開発手法を「スタンフォード生を連れてきて日本語を教える」ようなものであると表現。 ソフトバンクやNTTの「tuzumi」のようなフルスクラッチの開発するプレイヤーに対して、開発期間や費用で有利になる。 今回のモデルは、メタ(旧フェイスブック)が4月に公開したオープンなLLM「Llama 3」をベースに開発。開発期間は3カ月弱という短期間で、費用は数千万円台で収まった。 ELYZAが学習のために集めていたデータセットをそのまま活用し、Llama-3をチューニングしたことで、性能向上分の恩恵を受けられたという。 曽根岡氏は「Llama-3という優秀なモデルが出てきたことが、1つ我々を後押し」と述べつつ、AI開発における最新の手法を細かく取り入れたことも重要だったと強調した。
KDDIとの資本業務提携は早くも効果
さらに、3月に発表したKDDIグループとの資本業務提携も開発を加速した背景にある。 KDDIは4月にELYZAに対しグループで 出資・連結子会社化 。この提携により、計算基盤に対する大胆な投資がしやすくなり、効率的な開発が可能になったという。 さらにKDDIと協力して開発しているのがコールセンター向けのLLMだ。 KDDI傘下にはコールセンター代行大手のアルティウスリンクがある。同社の豊富な業界知見を活用し、ELYZAは実用に即したLLMの開発を進めている。 さらに、アルティウスリンク社の広範な販売網を通じて、開発したLLMの市場展開を図る方針だ。
石井 徹