別人の声に即変換、カスハラ対策やライブ配信で活用…NTTが実用化目指す
NTTは、人の声をリアルタイムで別人の声色や話し方に変える音声変換技術を発表した。自然な話し声に変換することができ、実用化されれば、コールセンター業務での「カスハラ(カスタマーハラスメント)」対策としたり、発声障害を持つ人の声を聞き取りやすくしたりすることなどが可能という。
AI(人工知能)で話し声の音声データから、年齢や性別、感情の変化による声色・抑揚の違いなど、その人固有の「くせ」を除去する。そのうえで目的とする声質の特徴を加える。瞬時に自然な声に変換することで違和感なく会話できるとしている。
好きなキャラクターの声質に変換すれば、ライブ配信や仮想空間「メタバース」の楽しみが広がる。聞き取りやすい声質に変換すれば、ウェブ会議やコールセンター業務での意思疎通を、円滑化することが期待できる。
将来的には威圧的な声を穏やかな声にしたり、外国語の発音を滑らかにしたりすることも目指す。実用化に向け偽動画「ディープフェイク」への悪用を防ぐ対策も進めるという。