OpenAIの投資計画はアポロ計画の70倍?加速し膨張するAI開発投資、バブルの懸念も
AI開発競争は半導体産業にも影響
AI開発の規模拡大は、半導体産業にも影響を与えている。 半導体メーカーNVIDIAは、AIの学習に用いる半導体(大規模集積回路)を事実上独占しているため、AIブームの過熱で大儲けをした。同社の2024年1月期の決算は売上高が前年同期比2.3倍の609億ドル(9兆5000億円)、営業利益が同7倍の330億ドル(5兆1480億円)と絶好調である(発表資料)。 株価も上昇し、時価総額は一時3兆ドル(468兆円)を超え、Appleを上回った。AI開発に取り組む各社はNVIDIAの半導体の奪い合いをしている状態だ。Google、Amazon、マイクロソフトは自社開発のAI向け半導体開発に取り組んでいるが、NVIDIAの勢いはまだまだ続きそうだ。 しかし、NVIDIA以外の企業は儲かっていないようだ。ベンチャーキャピタルのセコイアによれば、2023年にAI業界はNVIDIA製半導体に実に500億ドルを投じた。しかしAI業界全体の売上げはわずか30億ドルだったという。またOpenAIの売上高は非公開だが、英国の経済紙フィナンシャル・タイムズ(FT)は「20億ドル以上」と報じている。いずれも巨大投資に釣り合わない金額だ。 AIが大規模化で高性能になったことで、AIブームが発生した。AIブームによりAIの大規模化の競争はさらに過熱した。過熱し、加速する競争の果てに、いったい何が待ち受けているのだろうか。
AI開発の最新トレンドは「マルチモーダル」
AIで性能を上げるには大規模化が重要だった。だが大規模化に伴う課題もある。一つは学習用データが枯渇してしまうこと。もう一つは投資規模があまりにも巨大になりすぎることだ。 まずデータ量の問題を見ていこう。当初のChatGPTはインターネットから収集したテキストデータを学習に用いていた。だが、それだけではデータ量が足りなくなり、Googleが運営する動画サービスYouTubeに投稿された動画から100万時間以上を書き起こしたテキストデータを学習に用いていたと報道された。 OpenAIやGoogleなどAI開発企業の最新トレンドは「マルチモーダル」である。例えばGPT-4oのように人間と音声で対話したり、カメラで表情を読み取ったりする機能や、動画を生成する機能などを競っている。 こうした動きの背景には学習用データの枯渇問題がある。例えば、4月6日付のニューヨーク・タイムズ紙の記事は、AI開発企業がデータ収集競争に明け暮れていることを伝え、「インターネット上で手に入るデータは貴重で有限な資源である」と述べている。 AI開発企業はいまやインターネット上のテキスト情報を使い果たし、テキスト以外の情報――動画や音声、人間との会話などに目を向けるようになっているのである。 データ量とは別に、学習データの著作権問題も今後深刻になる可能性がある。 米ニューヨーク・タイムズ紙は2022年12月27日、OpenAIとマイクロソフトを著作権侵害で提訴した。著作権で保護された何百万もの記事を、ChatGPTのようなAIシステムを学習させるために無断で使用し、現在ユーザーの情報源としてタイムズ紙と競合していると主張した。一方、OpenAIは、記事データの利用は「フェアユース」にあたると主張し、また訴訟のために特殊な操作を行い、記事を再現したと応酬した。 最近、OpenAIは、英紙FTや大手掲示板のReddit、それに経済紙ウォールストリート・ジャーナル(WSJ)の親会社であるNews Corp、それに『The Atlantic』誌と提携した。伝統的な大手経済紙、雑誌、それに大手掲示板の内容をAIサービスで利用できるようにする計画だ。AI開発企業にとっても、著作権問題がクリアで信頼できる最新情報は重要なのである。