声と話し方を好みのスタイルに一瞬で変える ~高音質かつ低遅延なリアルタイム音声変換~
Digital PR Platform / 2024年6月17日 10時0分
[画像3]https://digitalpr.jp/simg/2341/89983/700_247_20240614175757666c061539a72.PNG
図3. 低遅延なモデル
3.実験の概要
従来法・今回の手法を用いて変換した音声の品質を、音質に関しては5段階(1: 非常に悪い、2: 悪い、3: 普通、4: 良い、5: 非常に良い)、目標話者との話者類似性に関しては、4段階(1: 違う、2: 多分違う、3: 多分同じ、4: 同じ)の評価尺度で聴取実験を行いました。特徴量変換器では、従来法に比べ、音質・話者類似性ともに従来法を大きく凌ぐ結果となり、発話者の違いにより生じる差異を明示的に小さくする今回の手法が有効であることがわかりました(図4)。
[画像4]https://digitalpr.jp/simg/2341/89983/700_275_20240614175757666c06154e221.PNG
図4. 実験の結果
5.今後の展開
本技術により、発声機能障がいへの活用(例えば、無喉頭音声の聞き取りやすさの改善)、ネイティブに近い流暢な英語の発音、説得力のあるスピーチ、緊張による声の震えの解消など、対面・遠隔を問わずビジネスや実生活の多様なシーンにおいて音声コミュニケーションを豊かにすることが期待されます。
今後は、実環境使用を想定した対雑音性向上や安定性向上などに取り組むと共に、なりすましへの対策などにも取り組み、より安心して好みの音声でコミュニケーションできる未来をめざします。
【用語解説】
※1.深層学習:機械学習の1種でディープラーニングとも呼ばれることもある、近年注目されている学習手法
※2.話者依存性:元話者の声や発音の特徴がどれだけ影響を与えるかを示す性質
※3.無喉頭音声:喉頭を使わずに発声された音声、例えば電気式人工喉頭を用いて発声された音声など
この記事に関連するニュース
-
世界初、IOWN APNの低遅延性能によりクラウド上で映像処理を行う内視鏡システムで内視鏡医がリアルタイムな診断・治療が実現可能なことを実証
Digital PR Platform / 2024年11月19日 15時37分
-
エンドツーエンド光接続時の波長を有効活用する長距離光伝送技術を確立 ~光と電気アナログ信号による波長変換技術を活用した光ノードシステムを開発~
Digital PR Platform / 2024年11月12日 15時7分
-
エンタメ大国・韓国発AIオーディオ企業「Supertone」の実力 日本市場をいかにして攻略するか?
ITmedia ビジネスオンライン / 2024年11月9日 17時48分
-
新方式の量子コンピュータを実現 ~世界に先駆けて汎用型光量子計算プラットフォームが始動~
Digital PR Platform / 2024年11月8日 13時5分
-
【東芝デジタルソリューションズ】RECAIUS音声合成ミドルウェア「ToSpeak」のハイエンド機器向けラインアップを強化
Digital PR Platform / 2024年11月6日 11時27分
ランキング
-
1日経平均株価が再度上昇するのはいつになるのか すでに「日柄調整という悪材料」は織り込んだ
東洋経済オンライン / 2024年11月25日 9時30分
-
2自然界最強「ミノムシの糸」を製品化、スポーツ用品や自動車に活用へ…興和「化学繊維に代わる存在に」
読売新聞 / 2024年11月25日 10時50分
-
3京都の老舗を支える「よきパートナー」という思想 自社だけでなく、客や取引先とともに成長する
東洋経済オンライン / 2024年11月25日 14時0分
-
4スエズ運河の船舶通過激減 パナマも、供給網負担重く
共同通信 / 2024年11月25日 16時29分
-
5あなたは気づいてる?部下が上司に抱く不満8選 部下は上司への不満を言わないまま辞めていく
東洋経済オンライン / 2024年11月25日 9時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください