しぐれうい、犬山たまきらも参加で話題 VTuber/Vアーティストによる音声合成ソフトが続々登場する理由は?
10月2日、イラストレーター/VTuber・しぐれういのAI歌唱ソフト「VoiSona 雨衣(うい)」が、2025年に向けてリリース予定と発表されたことに衝撃が走った。 【画像】音声合成ソフトに参加した犬山たまき VoiSonaは、株式会社テクノスピーチが2022年9月に提供を開始した音声創作ソフトウェアで、後述するCeVIO AIの姉妹ブランドとしての立ち位置にある。歌声合成ソフトを世界に広めた発端として、いの一番に挙げられるのは、ヤマハが開発したVOCALOIDだ。初音ミクを抜きにしてVOCALOIDを語ることはできないが、突然シーンに高速エンジンをかける音声合成ソフトが存在するのも確かだ。直近では2023年4月に株式会社AXSによるSynthesizer Vで利用可能な歌声データベース「Synthesizer V AI 重音テト」の発表以降、重音テトが使われたボカロ曲がネットシーンを席巻した。 とりわけボカロシーンに与えたインパクトが大きかったのは、2021年7月にクリエイティブレーベル・KAMITSUBAKI STUDIOが株式会社テクノスピーチを中心に複数企業が開発した音声合成ソフト、CeVIO AIとコラボして制作された、同レーベル所属のバーチャルシンガー・花譜の声を元にした音楽的同位体 可不(KAFU)だ。ツミキの「フォニイ」、柊マグネタイトの「マーシャル・マキシマイザー」などが代表的な可不(KAFU)を使用した楽曲だが、ユーザー発想の「可不がカレーうどん食べるだけ」から、可不(KAFU)=カレーうどんのイメージが広がりN次創作が拡散されたことも、初音ミク=ネギと同様に、彼女の存在の大きさを物語る。 2022年以降、同レーベルからは花譜も所属するバーチャルアーティストグループ・V.W.Pのメンバー4人の音声合成ソフトも順にリリースされたほか、2023年には活動休止中のキズナアイの歌唱特化型AI「#kzn」、2024年にはVTuber ・犬山たまきの歌声合成ボイスライブラリ「玉姫」がVoiSonaからリリースされるなど、VTuberやVアーティスト発の音声合成ソフトが続々と増えている。 VTuberやVアーティストの個性的な声は、音声合成ソフトで目立つ要因のひとつだ。加えて、これほど多くの音声合成ソフトを生んでいる理由は、つまるところ、VTuberと音声合成ソフトの文化的親和性にあるだろう。VTuberやVアーティストが歌う楽曲はボカロ曲が中心で、彼らのオリジナル曲もボカロPが制作することが多い。一方で、VTuberやVアーティストは音声合成ソフトでボカロシーンに新しいトレンドを生み出す。もはや双方のシーンの発展の点でも互いが目を離すことのできない存在で、この緊密した関係性こそが、VTuberやVアーティストの音声合成ソフトがボカロシーンで真っ先に話題をさらう要因だと思う。 Live2Dモデルや3Dモデルといったハイテク技術で作られるVTuberやVアーティストのデジタルキャラクターと、深層学習等の最新のAI技術を用いた音声合成ソフトとの技術的相性が抜群にいいことも言える。特に、インターネット上の仮想空間を指すメタバース、次世代の分散型インターネットの時代の概念であるWeb3などの最先端領域にも鋭くアンテナを張っているKAMITSUBAKI STUDIOの音楽的同位体プロジェクトはその象徴である。 また、VTuberやVアーティストシーンにおいて、デジタルキャラクターのビジュアルは間違いなく重要な要素であり、音声合成ソフトのビジュアルとシンクロすることで、花譜と可不の「キュートなカノジョ」のような融和性のある作品を創造することも可能。それぞれのビジュアルが今後どのように絡み合い、シナジー効果を生むのか、SFチックなデジタルの特性が表現の多様性を無限に広げるのも大きなポイントだ。 ネット発のボカロ、VTuberやVアーティスト、音声合成ソフトといった同じ系譜の存在がデジタル領域で繋がり、サイクルが勢いづいていく。AIが人の仕事を奪うーーそれどころか、人がAIをうまく活用している。さらなるテクノロジーの進化の先に、シーンを加速させるカタリストが生まれることを楽しみにしている。
小町碧音