エヌビディア、音楽や音声を生成する新たなAIモデル発表
Stephen Nellis [25日 ロイター] - 米半導体大手エヌビディアは25日、音楽や音声を生成する新たな人工知能(AI)モデル「Fugatto」を発表した。声を修正したり、奇抜な音声を作り出したりすることができる。音楽、映画、ビデオゲームのプロデューサーに使ってもらうことを狙いとする技術だ。 ただエヌビディアは、この技術を一般に公開する計画は今のところないとしている。Fugattoは「ファウンデーショナル・ジェネレーティブ・オーディオ・トランスフォーマー・オーパス・1」の略。 これによりエヌビディアは、メタ・プラットフォームズや新興企業ランウェイなどテキストから音声やビデオを生成できる技術を開発した企業に加わることになる。 エヌビディアの技術では、テキストから音響効果や音楽を生成する。犬のように吠えるトランペットといった奇抜な音を作り出すこともできる。 他社の技術と異なるのは、エヌビディアのAI技術には既存の音声を取り込んで修正する能力がある点だ。例えば、ピアノの演奏を人の声による歌に変換したり、録音された人の話で使われたアクセントや表現されたムードを変更したりすることもできる。 エヌビディアはこの技術を一般公開するかどうか、公開する場合はその方法について、依然として検討中。エヌビディアのバイスプレジデント、ブライアン・カタンザーロ氏は「いかなる生成技術もリスクを伴う。われわれが好ましくないと考える物を人が生成する可能性があるためだ」と指摘。「われわれはこの技術に対して慎重になる必要がある。即座に公開しないのは、そうした理由があるからだ」と説明した。