AIの学習データをめぐる競争 アップルとシャッターストック提携などに見る競争激化とその最新動向
活性化するAIの学習データ市場
AIのトレーニング・データに対する需要の高まりと、それに伴う市場の活性化は明らかだが、ロイターの報道によると、コンテンツの種類や買い手によって、このようなAI学習用データの価格には大きなばらつきがある。 例えば、AIデータ会社Defined.aiのダニエラ・ブラガCEOは、ロイターのインタビューに、企業は一般的に画像1枚につき1~2ドル、短編動画1本につき2~4ドル、長編動画1時間につき100~300ドル、テキストは1単語につき0.001ドル程度を支払うと答えている。 シャッターストックの競合企業であり、約2億枚の画像アーカイブを保有するFreepikは、その大部分を1画像あたり2~4セントでライセンス供与する契約を大手ハイテク企業2社と結んだとロイターに語っている。
グーグルはRedditのデータ独占利用権獲得
一方、グーグルは、AIシステムを訓練するためのデータに独占的にアクセスするため、アメリカの投稿プラットフォームRedditと、年間6,000万ドルの契約を結んだと報じられている。 Redditは日本ではそれほど知られていないが、アメリカ版2ちゃんねると呼ばれるほど、アメリカやイギリス、カナダ、オーストラリアなど諸外国で広く使用されている投稿プラットフォームだ。この契約により、GoogleはRedditの保有する膨大なデータにリアルタイムでアクセスできるようになるという。 RedditのCEOのSteve Huffman氏は、「データライセンスは我々にとって新しい潜在的なビジネスだ」と述べており、同社はグーグル以外にも匿名のAI企業と6,000万ドルのAIトレーニング契約を結んだことがブルームバーグによって報道されている。
AIの学習データにまつわる論争も過熱
AIの学習データに関しては、その市場だけでなく論争も過熱している。 テック大手企業が、著作権で保護されたコンテンツを含む膨大なオンラインデータを、作成者からの明示的な許可なしにAIのトレーニングに使用している可能性がかねてより示されており、知的財産の侵害を訴えるメディアやクリエイターの声が高まっている。 トレーニングデータへのアクセス料をコンテンツ作成社に支払うライセンス制度を求める声もある米国では、議会の公聴会で、メディア業界からライセンスの義務化に賛成する意見が相次いだ。 しかし、すべてのトレーニングデータをライセンス供与することの実現可能性については疑問も呈されており、法的義務付けや業界の規範のありかたについては、まだ議論が続いている。
【関連記事】
- アップルも注目する最近の生成AIトレンド「小型LLM」、オフラインでも利用できる生成AIの登場とスマホ/ラップトップ市場へのインパクト
- アップルVision Pro、1,000個以上のアプリが登場。OpenAIのCEOは絶賛もメタ・ザッカーバーグCEOは厳しい評価、リリース後の賛否さまざまな声
- OpenAIサム・アルトマンCEOのAIチップ開発で7兆ドル調達の野望、GPU関連スタートアップの台頭など、激変するAIチップ市場の現状
- GAFAMに続くIBM、生成AIに焦点当てた5億ドルのベンチャーファンド設立 法人向けAIテックへの投資を加速
- YouTubeとユニバーサル・ミュージック、AI音楽の可能性模索で提携、業界では論争も