AIの学習データをめぐる競争　アップルとシャッターストック提携などに見る競争激化とその最新動向

5/19(日) 6:00配信

活性化するAIの学習データ市場

AIのトレーニング・データに対する需要の高まりと、それに伴う市場の活性化は明らかだが、ロイターの報道によると、コンテンツの種類や買い手によって、このようなAI学習用データの価格には大きなばらつきがある。例えば、AIデータ会社Defined.aiのダニエラ・ブラガCEOは、ロイターのインタビューに、企業は一般的に画像1枚につき1～2ドル、短編動画1本につき2～4ドル、長編動画1時間につき100～300ドル、テキストは1単語につき0.001ドル程度を支払うと答えている。シャッターストックの競合企業であり、約2億枚の画像アーカイブを保有するFreepikは、その大部分を1画像あたり2～4セントでライセンス供与する契約を大手ハイテク企業2社と結んだとロイターに語っている。

グーグルはRedditのデータ独占利用権獲得

一方、グーグルは、AIシステムを訓練するためのデータに独占的にアクセスするため、アメリカの投稿プラットフォームRedditと、年間6,000万ドルの契約を結んだと報じられている。 Redditは日本ではそれほど知られていないが、アメリカ版2ちゃんねると呼ばれるほど、アメリカやイギリス、カナダ、オーストラリアなど諸外国で広く使用されている投稿プラットフォームだ。この契約により、GoogleはRedditの保有する膨大なデータにリアルタイムでアクセスできるようになるという。 RedditのCEOのSteve Huffman氏は、「データライセンスは我々にとって新しい潜在的なビジネスだ」と述べており、同社はグーグル以外にも匿名のAI企業と6,000万ドルのAIトレーニング契約を結んだことがブルームバーグによって報道されている。

AIの学習データにまつわる論争も過熱

AIの学習データに関しては、その市場だけでなく論争も過熱している。テック大手企業が、著作権で保護されたコンテンツを含む膨大なオンラインデータを、作成者からの明示的な許可なしにAIのトレーニングに使用している可能性がかねてより示されており、知的財産の侵害を訴えるメディアやクリエイターの声が高まっている。トレーニングデータへのアクセス料をコンテンツ作成社に支払うライセンス制度を求める声もある米国では、議会の公聴会で、メディア業界からライセンスの義務化に賛成する意見が相次いだ。しかし、すべてのトレーニングデータをライセンス供与することの実現可能性については疑問も呈されており、法的義務付けや業界の規範のありかたについては、まだ議論が続いている。

次ページは：ニューヨーク・タイムズ紙はオープンAIとマイクロソフトを著作権侵害で提訴

2/3ページ

Yahoo!ニュース

AIの学習データをめぐる競争　アップルとシャッターストック提携などに見る競争激化とその最新動向

活性化するAIの学習データ市場

グーグルはRedditのデータ独占利用権獲得

AIの学習データにまつわる論争も過熱

【関連記事】

アクセスランキング（IT総合）

雑誌アクセスランキング（IT・科学）