金沢工業大学情報工学科OBの鈴木大志さんが学部4年次に取り組んだ研究が情報処理学会論文誌に採録。Any-to-Anyの音声変換をリアルタイムに行う手法の実装と評価で
Digital PR Platform / 2024年2月15日 14時5分
ゼロショット声質変換法では,多くの場合、
(1) 入力話者音声をメルスペクトログラムに変換し、
(2) 入力話者のメルスペクトログラムを出力話者のものに変換。
(3) 出力話者のメルスペクトログラムで音声信号を生成する。
という手順を踏みます。
この声質変換に要する時間が入力音声よりも短ければリアルタイム声質変換が可能ですが、(2) と(3) の両方で深層学習モデルを使うためGPUを使った演算量が増加し,それがリアルタイム声質変換の実現を困難にしていました。
この解決策として鈴木さんが提案したのは、音声の特徴量を「スペクトル包絡」、「基本周波数」、「非周期性指標」の3 つとし、深層学習モデルはスペクトル包絡の変換にのみ適用することで演算量を削減する方法でした。
深層学習モデルはAutoVC の構造をベースとして、前処理と後処理部分を変更したものを用いました。実験により、音声信号1 秒あたりの処理に要する時間はGPU 環境では0.2 秒以下となり、リアルタイム声質変換可能であることが示されました。
さらに従来のAutoVC と比べても品質が改善できていることもMOS(Mean Opinion Score)による評価結果から示されました。
※メルスペクトログラム
音響特徴量の一部。音声の周波数をフーリエ変換したスペクトログラムで、人間の音声知覚の特徴を考慮したものを特にメルスペクトログラム(mel spectrogram)と呼ぶ。
※スペクトル包絡
スペクトルの曲線族すべてに接している曲線を包絡線(ほうらくせん)と呼び、包絡線の表す山や谷などを「包絡」という。
※GPU
特定の 3D レンダリング・タスクの高速化などに特化したプロセッサー。グラフィックスとゲームに使われるほか、汎用的な並列プロセッサーとして、生成AIなどにも使用されている。
論文名:「AutoVCを用いたゼロショットリアルタイム声質変換手法の実装と評価」
執筆者:鈴木大志 鷹合大輔 中沢実
情報処理学会論文誌 Vol.65 No.2 529-537(Feb.2024) 発行年2024-02-15
▼本件に関する問い合わせ先
金沢工業大学 広報課
住所:石川県野々市市扇が丘7-1
TEL:076-246-4784
FAX:076-248-7318
メール:koho@kanazawa-it.ac.jp
【リリース発信元】 大学プレスセンター https://www.u-presscenter.jp/
-
-
- 1
- 2
-
この記事に関連するニュース
-
【高等学校 教員対象】「高等学校DX加速化推進事業」採択校向けDXハイスクール応援プログラムを開催。8月5日(月)・6日(火)の2日間[7月8日からお申し込み受付開始]--金沢工業大学
Digital PR Platform / 2024年7月9日 14時5分
-
東京工芸大学をはじめとする教職協働チームがGeoSciAI2024で最優秀賞(宇宙天気課題)受賞
PR TIMES / 2024年7月1日 17時15分
-
東京工芸大学をはじめとする教職協働チームがGeoSciAI2024で最優秀賞(宇宙天気課題)受賞
@Press / 2024年7月1日 12時0分
-
東京工芸大学をはじめとする教職協働チームが「GeoSciAI2024」で最優秀賞(宇宙天気課題)受賞
Digital PR Platform / 2024年7月1日 8時5分
-
リアルタイム低遅延ボイチェンのポイントは“個性の制限”? NTTが研究成果を発表する「オープンハウス」が6月24日から大阪で開催
ITmedia PC USER / 2024年6月19日 6時0分
ランキング
-
1セルフレジで客が減る? 欧米で「セルフレジ撤去」の動き、日本はどう捉えるべきか
ITmedia ビジネスオンライン / 2024年7月18日 8時10分
-
2電話番号案内104終了へ NTT東西、利用者激減で
共同通信 / 2024年7月18日 21時35分
-
3東証、一時1000円近く下落 円高進行で輸出関連に売り
共同通信 / 2024年7月18日 11時58分
-
4「レイバン」メーカー、人気ブランド「シュプリーム」を15億ドルで買収
ロイター / 2024年7月18日 8時34分
-
5申請を忘れると年金200万円の損…荻原博子「もらえるものはとことんもらう」ための賢者の知恵
プレジデントオンライン / 2024年7月17日 8時15分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)