AI市場の価格競争、OpenAIに対し圧倒的低価格を提示するスタートアップ登場で高まる値下げ圧力
企業が採用するアプローチに潜むコスト問題
セコイアキャピタルの調査によると、大半の企業(94%)がAPIを介してOpenAIなどの事前トレーニングされたモデルを活用している。最も人気なのはOpenAI(91%)だが、同時にAnthropicなど他社のAPIを利用するケースが増えていることも明らかになった。 この調査は上記で紹介した5つのアプローチのうち、3つ目のアプローチが多いことを示すもの。企業にとっては少ない開発リソースで高いパフォーマンスを持つ大規模言語モデルを活用できるアプローチであり、今後もこの傾向は続くものと思われる。 一方でこのアプローチには、コスト問題が潜んでおり、時間の経過とともに問題が深刻化する可能性も指摘されている。 現在最も優れたパフォーマンスを持つOpenAIのGPT‐4のAPIコストは非常に高い。入力(プロンプト)と出力(生成)でコストは異なり、3万2,000トークンを処理できる最も優れたGPT-4 32Kモデルの場合、入力は1,000トークンあたり0.06ドル、出力は1,000トークンあたり0.12ドルのコストがかかる。100万トークンで換算すると、コストは入力60ドル、出力120ドルだ。 一方、AnthropicのClaude2も入力100万トークンあたり11ドル、出力32.68ドルのコストがかかり、生成AIの利用が多くなる企業では負担増が避けられない。
生成AIのコスト問題に光明、圧倒的低価格を提示するスタートアップが登場
コスト問題は、企業が生成AI導入を踏みとどまる要因にもなっているため、早急な解決が必要だ。こうした中、生成AIのコスト問題に焦点を当てたスタートアップが登場し、注目を集めている。 2023年11月、低コストでの生成AIアプリケーション運用を支援するスタートアップDeepInfraが800万ドルのシードラウンド調達とともに、ステルスモードを解除しメディアデビューを果たした。 同社は、Llama2などのオープンソースモデルを自社のプライベートサーバーで運用するサービスを提供するスタートアップ。共同創業者は3人ともサーバーインフラ分野の高い専門スキルを持っており、主にAIアプリケーションのスケール運用に強みを持つ企業となる。 注目すべきは、その価格だ。 DeepInfraのプラットフォームで現在選択可能な最優秀AIモデルはメタのLlama-2-70b-chatだが、このモデルのAPI利用にかかる100万トークンあたりのコストは、入力価格0.70ドル、出力0.95ドルと圧倒的な低コストを提示しているのだ。 OpenAIのGPT-4 32Kモデルと比べると、入力コストの価格差は85倍、出力コストでは126倍以上となる。Anthropicとの比較でも、入力で15倍、出力でも33倍以上の価格差だ。 DeepInfraは、まずコストに敏感な中小企業を中心に、AIアプリケーションのホスティングサービスを展開する計画という。 市場リーダーといわれるOpenAIも現在法人営業においては、その高いコストが主な理由となり苦戦を強いられている。最近のイベントで、Anthropicを意識し、100万トークンあたり10ドルで利用できるGPT-4 Turboを発表したばかりだが、オープンソースモデルの台頭により、値下げ圧力は今後さらに強まることが予想される。
文:細谷元(Livit)