多言語音声データを用いた日本語音声合成モデルを開発
PR TIMES / 2024年10月9日 12時45分
数秒の音声データと日本語テキストだけで音声合成を可能に
[画像1: https://prcdn.freetls.fastly.net/release_image/38634/86/38634-86-caa2668adc9e11aacad71dd40f1603fc-1920x1080.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
AI総合研究所として活動するNABLAS株式会社 (本社 : 東京都文京区本郷、 代表取締役 所長 : 中山 浩太郎、 以下「当社」)は、多言語話者の声質を保持したまま、日本語テキスト音声合成を可能とするTTS ( Text-to-Speech ) モデルを開発しました。本モデルは、言語を問わない数秒の発話音声のデータを用いて、他言語話者の音声から流暢な日本語の音声合成が可能です。本技術により通訳や発話困難者への支援、映画や動画などのエンターテインメント作品の多言語化など、幅広い分野での応用が期待できます。
▼音声データはこちらで試聴いただけます。
https://www.nablas.com/post/voice-synthesis-202410
■開発の背景と概要
近年、様々な音声合成の活用が急速に広がり、自動音声案内や本の読み上げ、動画の吹き替えなど音声合成を活用した場面が増えてきました。しかし、これまでの音声合成では、声優やアナウンサーが事前に決められた文章を収録し、数分からなる音声データを元に声質を再現した音声モデルの構築が必要でした。また、日本語の音声合成の場合、日本語話者による音声モデルが必要となり、他言語の音声モデルでは流暢な日本語での音声合成は難しい状況でした。
これらの課題に対して、英語や中国語、韓国語など言語を問わない数秒の発話音声データから日本語テキストを読み上げ可能な音声合成モデルを構築し、日本語話者でなくても流暢な日本語による音声合成を可能としました。また、本モデルは、Google社が開発した音声生成モデル「SoundStorm」の構造をベースとして、当社開発の日本語対応音声生成モデルを活用しており、瞬時に日本語の音声合成が可能です。
SoundStormの日本語モデルに関するリリースについてはこちらをご覧ください。
https://www.nablas.com/post/japanese-voice-synthesis
[画像2: https://prcdn.freetls.fastly.net/release_image/38634/86/38634-86-5bffc417a90118a7fd5ac62ffe850e90-1920x1080.jpg?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
■本モデルの活用例
・発話困難者への支援
発話に支援を必要とされる方へ、自身または任意の音声データを用い、発言したい内容をテキスト入力し音声で出力することで発話における障壁の解消へと繋がります。
・言語学習および通訳における活用
多言語学習および通訳において、話者本人の音声データを用いて瞬時に音声合成が可能です。通訳者が翻訳内容をテキスト入力することにより、話者の声質そのままに日本語での発言が可能となります。
・エンターテインメント分野における活用
日本語吹き替えにおいて、吹き替え元となる音声を用いることで同一話者による日本語吹き替えが可能です。メディアやゲーム、オーディオブックなどコンテンツ制作のコストダウンや創作活動の幅を広げることに繋がります。
■今後の展望
音声合成技術は様々な分野での活用が期待される技術です。この度の多言語音声データを用いた日本語対応音声合成モデルの開発だけでなく、音声変換や、さらに高速となるリアルタイムでの対話翻訳など、日本での音声合成および音声生成技術の活用がより活発化するよう、引き続き技術開発を進めてまいります。また、それら生成AI技術の悪用防止や検出技術の開発にも引き続き取り組んで参ります。
■ お問い合わせ
NABLASの音声合成に関するお問い合わせは以下フォームからお気軽にご相談ください。https://www.nablas.com/contact
■NABLAS株式会社について
当社は東大発のベンチャーであり、AI人材教育・育成機関、そして最先端のAI技術、特にDeep Learning技術を活用したソリューションを提供するAI総合研究所です。AI人材育成事業では、東京大学で開発したAI人材教育コンテンツと当社でアップデートしたコンテンツを学習環境iLect Systemと共に、AI人材育成サービスとして提供しています。AIコンサル・R&D事業では、AI技術の導入・研究・開発について技術面でのコンサルティング業務を展開し、クライアントの状況に応じてAI技術の導入・開発など技術面でのサービス提供を行っています。AI技術の社会実装を様々な形で実現し、より良い未来を創造するための技術やサービスを探索・創造し続ける存在として、「Discover the gradients, Towards the future」のミッションのもと次世代を支える技術やサービスの開発に取りんでいきます。
■会社概要
社名:NABLAS株式会社
代表者:代表取締役 所長 中山 浩太郎
本社:東京都文京区本郷6-17-9 本郷綱ビル1F
設立:2017年3月
事業内容:AI人材育成事業/コンサルティング/研究開発
URL:https://nablas.com
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
rinnaの「Virtual Human Talk」を採用したAI タナカヒトミが「WBS」年末3時間生放送に登場
PR TIMES / 2024年12月26日 14時40分
-
AIオーディオ企業のSupertoneがAPI公開、AI音声技術の活用広げる
PR TIMES / 2024年12月25日 12時40分
-
オフショアカンパニー、提供する「AI動画翻訳くん」「AI縦型動画」を、AI分野 国内最大の展示会*¹『AI World 2024 冬 大阪』に出展
PR TIMES / 2024年12月12日 15時30分
-
YouTube、AI採用の日本語を含むマルチ言語吹き替え機能を提供開始
ITmedia NEWS / 2024年12月11日 11時52分
-
Teams対応AI翻訳、DeepLが音声市場に進出 上場企業8割導入の実績、音声分野で第三の柱確立へ
東洋経済オンライン / 2024年12月4日 13時0分
ランキング
-
12025年の景気は「緩やかな回復が持続」…経済評論家・塚崎公義氏が予想
THE GOLD ONLINE(ゴールドオンライン) / 2025年1月2日 9時15分
-
22025年 日銀「次の利上げ」はいつ? 「市場との対話」の改善は
日テレNEWS NNN / 2025年1月2日 15時0分
-
3ビットコインの命運握る「アメリカの戦略備蓄案」 1月20日のトランプ大統領就任で構想が動き出す?
東洋経済オンライン / 2025年1月3日 7時50分
-
4SKY-HIが「上司には無邪気さが必要」と語る真意 若手部下とのコミュニケーションの極意とは
東洋経済オンライン / 2025年1月2日 8時0分
-
5丸ノ内線の旧型車両が「ひっそりと完全引退」していた!? 実は“一時的に復活”も36年の活躍に幕
乗りものニュース / 2025年1月3日 7時42分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください