AIが歌う「シングルベッド」に人は感動できるか つんく♂、AI研究者の酒巻氏と語る
AIが歌う「シングルベッド」に感動する可能性は
今後AIが進化を続け、作詞作曲など曲作りに活用され効率化して行く中で、変化してはいけない部分、あるいは変化して行ったほうが良い部分を、つんく♂はどう考えているのか。 つんく♂:クラシック音楽が根付いてずいぶん経つけど、ピアノの鍵盤と音符があって、それをベースに現在の誰もが曲を作っているわけです。誰かが決めた規則の中でやってる。AIはその鍵盤の法則を打ち破ろうとするのか、しないのか…。それを勝手に奔放に作り始めたら、何かが覆っちゃうかもしれない。日本語の五十音順の間に何か新しい文字を作り始めるとか。音楽として今ある音階と音階の間に2個くらい音階を作ってでも作曲し始めたら前提が覆っていくわけでしょ? AIはどこまで表現出来て、そしてそれを受け取る側にとってどこまでが気持ち良くて、どこからが気持ち悪いのか。この辺の受け取る側の需要にもよるし、感性としての包容力も違ってくる。 酒巻:今は、ある中立な感情をデータとして収録するとします。その収録データから、収録にはない高さや低さなどの声であっても、中立な感情のであれば合成音として声は生成できます。今、多くは中立な感情でデータをつくってますが、仮に喜怒哀楽の4感情を別々に収録するなら、喜怒哀楽の合成音がつくれます。それらを組み合わせたなら、ある程度の感情表現すら今の技術では出来ます。ただそのAIが感情を込めて歌う「シングルベッド」に、AIが歌っていると知っている歌に、人は本当に感動するんですかね? つんく♂:時と場合かもしれないけど、可能性はゼロじゃないって気はする。ただボーカリストのディレクションをする時に一番メンバーに伝えることは、「感情を込めて上手に歌おうとしないでね」って伝えます。お芝居みたく「台本に沿って演技する」も同じだけど、台本を読み込んでるってことは未来を知っちゃってるわけです。 未来を知った上で演技するわけなので、ちょっと感情をこめると前もって「今から怒ります」とか「今から悲しい顔します」みたいな演技になります。でも、実際生きてる時は、突然ムカつくことが起こるから「ムカっ」とした顔するし、急に別れを告げられたりするから悲しい顔になるわけで、予測してなかったところからの急激な気持ちの変化は自然に起こるものです。 演技にしても歌唱にしても前もって内容を知ってるからこそ、感情を込めて歌おうなんてしてはいけないって僕はそう感じています。だからボーカロイド的なものが感情を足していけばある種コントみたいになるとは思う。けど、それはかえって自然かも知れないとも思う。そこはやっぱり人間の作り手側のさじ加減な気もするなとは思う。 酒巻:そうなりますと…なかなかつくる難易度は高そうですね、今のAIはまだボディを持っていないことが一般的です。したがってまだ人とは異なり、体験した記憶、人生の歴史がありません。そうなると歌詞の風景にあわせて、じんわりとこれまでの体験や記憶をもとに感情をこめて表現するってところをつくるのは構造的に難しいと思いました。