OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
4月15日、OpenAIが日本オフィス開設を発表した。すでに報道されているように、アジアとしては初の拠点、本拠地であるサンフランシスコ以外の拠点としては英国のロンドン、アイルランドのダブリンに続く3か所めとなる。 生成AIグラビア写真集 もっとも、昨年OpenAIのCEO サム・アルトマンが来日した際には、すぐにでも日本での活動拠点を設けるとの話をしていたから、予想よりも時間がかかったということになるだろう。その背景としてあるのは、最高の人材を確保したいためという理由があったようだ。 日本法人の代表は、2月までアマゾンウェブサービスジャパン(AWSジャパン)で代表取締役社長を務めた長崎忠雄氏。同氏は保守的だった日本の企業向け市場においてクラウド活用を推進するため、粘り強く対話してクラウド型のプラトフォームを根付かせた功労者だ。 OpenAIが開発する様々なAIサービスを日本で根付かせるという意味ではまさに適任ではあるのだが、この手法はOpenAIが日本でどのような事業を行っていたいのかを透かして見る上で重要な発表だった。 本誌の読者は、日本オフィスが生まれることで、一体OpenAIの何が変化するのか? というところが気になるのではないだろうか。エンドユーザーとしてはChatGPTがどうなるのか、技術開発に興味がある人にとっては、日本がAIの新たな技術発信拠点となっていくのか? といったところも気になるかもしれない。もちろん国産AIの開発がこれによって影響を受けないか? といったことを懸念している人もいるかもしれない。 そこでこのコラムでは、テクノロジーに興味のある人、OpenAIのChatGPTをユーザとして使っている人たちがどのような影響を受けるのかについて話をしたい。
日本語カスタムモデルで何が変わるの?
OpenAIの日本オフィスが生まれると聞いて、新たに日本でAI技術の開発が行われると期待していた人たちには肩透かしの発表内容だったかもしれない。 実は、発表会場でも記者からはやや誤解を感じる質疑応答があった。短時間での記者会見では詳細が分かりにくいこともあり、行き違いは不思議ではないのだが、このやりとりにはとても重要な要素が含まれている。 OpenAIは"GPT-4の日本語カスタムモデル"の提供が開始されたことアナウンスした。 AIモデルに日本語に適したカスタマイズを施すことにより、速度は最大で3倍、効率も大幅に改善し、使用されるトークンはあるアプリケーションにおいて47%削減されたとされる。 この発表に対して、こんな質問があったのだ。 「日本語カスタム版の提供に際して、どのような日本の文献データを使って学習させたのでしょうか?」 記者発表の中では、単純に"AIモデル"が日本語にカスタマイズされたものとしか紹介されていなかった。学習のデータモデルが日本語に最適化したのだろうと考えての質問だったのだと思う。 実際には、日本語の文章の解釈や作成における語順等の最適化をAIの推論モデルにおいてカスタム化し、データを学習させる上での重みづけについて日本語に適した形へと変更したようだ。 ようするに最終的に作られたAIモデルが日本語に適しているということであり、日本語の文章作成能力や解釈をする能力が高まっている事は確かだが、そう単純ではないということがわかるだろう。 実際、ChatGPTを使っていて、日本語の文章が不自然だと思っている方は少なくないと思う。さらに不自然なだけではなく、効率の点でも悪かったため、速度が3分の1、トークンもおよそ2倍多く消費していたということもできる。 つまり、日本語圏でOpenAIが大規模言語モデルを使った事業を広げていく上で、日本語という特殊な言語に対応していく事は必要不可欠であるため、その最適化を図ったということだ。 日本に拠点を据えて特別な開発を行っていくといった文脈ではなく、日本というAI活用が注目されている大きな市場において、実用的なAIサービスを作るための拠点を置いたと言う方が正しいだろう。 今後、数か月以内にAPIを通じたアクセスも解放されるとのことだが、日本語対応のカスタムモデルを用いることにより、OpenAIのサービスを通じて開発しているアプリやサービスは大幅にコスト削減できるはず。 これはAIサービスをAPIとして引用し、自社のアプリケーションサービスに組み込んでいる企業にとっても大きな違いだとは思う。 ただ、OpenAIがこうした対応をとったことによって、国産AIプロジェクトに関しては、その優位性が失われる可能性があるかもしれない。
【関連記事】
- OpenAI日本オフィス誕生で何が変わる?日本語最適化の本当の狙いを読み解く(本田雅一)
- OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上
- Synthesizer Vのメーカーが作った、10秒の音声ファイルがあればリアルタイム歌声変換できるAI技術「Vocoflex」はRVCを超える?(CloseBox)
- 日常会話や会議を全学習するAIデバイス『Limitlessペンダント』発表。ヒトの知的能力を拡張するパーソナルAI『Limitless』サービス開始
- Adobe、Premiere Proの生成AI機能を先行公開。OpenAI SoraやRunwayのモデルも統合、物体の追加・削除やフレーム生成など