「日本初」団体認定の“無許可で学習しない”画像生成AIで登場 学習元データはすべて「明示的な許諾済み」
基盤モデルを使用せず、権利的に問題のないデータのみを学習した画像生成AIモデル「Mitsua Likes」を株式会社アブストラクトエンジンが公開した。同社のAI VTuber「絵藍ミツア」プロジェクトの一環として開発されたこのAIは、米国の非営利団体Fairly Trainedから、著作権保護期間中の著作物を無許可で学習していないことを認定された「日本企業初」のモデルとしてアピールしている。 【画像】学習元の透明性を特徴とするモデルの出力例 発表されたMitsua Likesの最大の特徴は、学習データの透明性とデータの権利への配慮がある。開発にあたり既存の基盤モデルを一切使用しないことで、クリーンなオリジナルのモデルを開発。学習データは、明示的な許諾を得たデータ、パブリックドメインやオープンライセンスのデータのみを使用しているという。 その証拠として、用いたすべての学習データは公式ウェブサイトやDiscordサーバーで公開。さらに、生成された画像には必ずクレジット表示が行われ、学習元の作者を明確にすることで既存の問題点の解決を図る。 現在、Mitsua Likesは約58,000枚の画像、577体のVRMモデル、827のVRMAポーズ、923のVRM Shoot!データを学習している。また、人気キャラクターとのコラボレーション画像生成も可能となっており、権利者から明示的な許諾を得た素材を使用しているとのこと。 2025年1月からは、新たな学習画像の募集も開始予定。詳細については、同社公式ウェブサイト()で確認できる。 ※参考:プロジェクトが定義する「権利的問題をクリアした画像」とは 1.権利クリアなデータのみで学習:既存の基盤モデルは一切使用せず、完全オリジナルモデルを開発。完全オプトインで明示的に許諾を得たデータ、安全なパブリックドメインやオープンライセンスのデータを、契約・規約を遵守して取得・学習しています。 2.AI生成データの学習なし:学習データに別の画像生成AIの生成画像やLLM/VLMの生成テキストは含まれていません。 3.学習データはすべてオープンに:すべての学習データは公式Webサイト(一部のみ)およびDiscordサーバーで公開され、高い透明性を担保しています。また、規約違反の画像に対する通報にも迅速に対応しています。 4.生成データの先生もわかる:生成データにはクレジット表示を必須にすることで、学習元の絵の先生たちを確認でき、手描き僭称などのトラブルを未然に防ぎます。
編集部 IT/デジタル担当