新連載「AIだけで作った曲を音楽配信する」。生成AIが作り上げた架空バンド「The Midnight Odyssey」を世界デビューさせる、その裏側
架空のアー写に感じる人間味
それならばと、我々のようなインディ系のレーベルと配信プラットフォームをつないでいるディストリビューター(アグリゲーター)にその是非を確認することにしました。 Apple MusicやSpotifyのようなグローバルな配信プラットフォームは、インディ系のレーベルと直接取引はしてくれません。直接取引可能なのは、メジャーレーベルだけです。 弊社は、iTunes Music Storeがオープンした当時から「ライツスケール」というディストリビューターに配信を依頼しています。長い付き合いなので、事前の根回しなしに、唐突に生成AI楽曲を依頼することは、心情的にはばかられます。 ライツスケールからは、「現状は配信OK。しかし、今後プラットフォーム側の方針が示され、生成AIがNGになった場合は削除する」という条件付きでOKを取り付けました。 アルバムのカバーアートも必要です。3000×3000ピクセルと結構な高解像度の画像を準備しなければなりません。以前は低解像度でもOKでしたが、筆者の記憶が正しければ、AppleがRetinaディスプレー製品を出し始めたタイミングで高解像度画像が求められるようになりました。 アルバムのカバーアートは、松尾氏が生成AIで描いた「いかにもプログレ!」という下記の画像を設定しました。かっこいいですね。筆者はこれを見た瞬間、「Dream Theater」のアルバムを連想しました。 さらに、「アー写」(アーティスト写真)も必要です。架空のバンドではありますが、アー写があることで、たとえそれが生成AIによる成果物であっても、偶像や虚構の中にちょっとした人間味を感じることができます。
ステム音源を用意してミックスをやり直す
配信に向けての事務的な作業を終えると、次は音源の準備です。Sunoが吐き出す音源は、圧縮音源特有のシュワシュワレロレロといったノイズが乗っています。非可逆処理に起因するノイズなので、ある程度は目をつむるしかありません。Lo-Fiな味と思えばよろしいわけです。 筆者としてはノイズよりも、各パート間のバランスや凹凸を欠いた平坦なレベル感の方が気になります。“素"の音源のままでは、ボーカルやオケの表情がいまひとつです。ただ、Sunoが生成する楽曲は、完パケミックス音源です。バランスを変えたり任意の箇所だけレベルを変えるといった処理ができません。 そこで、松尾氏に依頼して、音源のセパレーションツールを利用して ボーカルやドラムを抽出したステム音源を準備してもらいました。無料アプリの「ULTIMATE VOCAL REMOVER V5」(UVR5)を利用しています。 これにより(1)ボーカル、(2)ドラムス、(3)ベース、(4)その他の4トラックのステム音源が完成しました。 可能ならギターやシンセサイザーの分離トラックも欲しいところですが、このソフトの処理としては、その他でひとまとめにされています。SteinbergのSpectraLayer Pro 10では、ギターとピアノを独立したステムで分離できますが、4万1800円とかなり高価です。