1. トップ
  2. 新着ニュース
  3. 経済
  4. 経済

エヌビディア、音楽や音声を生成する新たなAIモデル発表

ロイター / 2024年11月26日 11時11分

 11月25日、米半導体大手エヌビディアは、音楽や音声を生成する新たな人工知能(AI)モデル「Fugatto」を発表した。写真は同社のロゴ。米カリフォルニア州で撮影、提供写真(2024 ロイター/NVIDIA)

Stephen Nellis

[25日 ロイター] - 米半導体大手エヌビディアは25日、音楽や音声を生成する新たな人工知能(AI)モデル「Fugatto」を発表した。声を修正したり、奇抜な音声を作り出したりすることができる。音楽、映画、ビデオゲームのプロデューサーに使ってもらうことを狙いとする技術だ。

ただエヌビディアは、この技術を一般に公開する計画は今のところないとしている。Fugattoは「ファウンデーショナル・ジェネレーティブ・オーディオ・トランスフォーマー・オーパス・1」の略。

これによりエヌビディアは、メタ・プラットフォームズや新興企業ランウェイなどテキストから音声やビデオを生成できる技術を開発した企業に加わることになる。

エヌビディアの技術では、テキストから音響効果や音楽を生成する。犬のように吠えるトランペットといった奇抜な音を作り出すこともできる。

他社の技術と異なるのは、エヌビディアのAI技術には既存の音声を取り込んで修正する能力がある点だ。例えば、ピアノの演奏を人の声による歌に変換したり、録音された人の話で使われたアクセントや表現されたムードを変更したりすることもできる。

エヌビディアはこの技術を一般公開するかどうか、公開する場合はその方法について、依然として検討中。エヌビディアのバイスプレジデント、ブライアン・カタンザーロ氏は「いかなる生成技術もリスクを伴う。われわれが好ましくないと考える物を人が生成する可能性があるためだ」と指摘。「われわれはこの技術に対して慎重になる必要がある。即座に公開しないのは、そうした理由があるからだ」と説明した。

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください