「ハシ」などのイントネーションを使い分けられる音声合成のAIシステム開発
Techable / 2021年6月16日 10時0分
大日本印刷株式会社(DNP)と株式会社DNPコミュニケーションデザイン(DCD)は、誤読やイントネーションおよびアクセントの間違いを減らし、人の間合いに近い自然な音声合成を自動生成できるAIシステムを開発しました。
正確率約85%以上同システムには、単語の読みや発音において間違いのない音声データを機械学習させています。大きな特徴のひとつは、文章の文脈を加味してイントネーションとアクセントを自動生成できること。例えば、「橋」「箸」「端」などイントネーションによってまったく違うモノを表す言葉や、「行って」のように「いって」や「おこなって」など文脈によって読み方が違う言葉を正しく生成するようです。これにより、特に正しい読みやナレーションを重視する学校教材や電子書籍などに利用しやすくなるでしょう。
また、正確な読み仮名を自動付与できることも特徴のひとつです。これは、約款や契約書、自治体・行政機関の公式文書など文量や専門用語が多く、かつ正確な情報提示が必要な文書への利用に適しているでしょう。
同システムは、従来のDNPの音声合成の制作と比較して誤読やイントネーション間違いなどを約50~70%削減。現時点で、複数の生命保険会社の約款で汎用性の検証を実施したところ、「読み」「アクセント」「間」について約85%以上の正確性が確認されています。そして今後の追加学習によって読みの正確性やイントネーションなどの精度はさらに向上するとのことです。
同システムの紹介動画はこちら。
音声合成技術の進化最近では、コエステ株式会社が、自分の声の分身を作れる「デジタルボイス・プレミアム」を2020年9月にリリース。最先端の音声合成技術によって、個人の声色や喋り方を学習し、作成された「コエ」で、入力したテキストを読み上げることができるというサービスです。
また、株式会社Yellstonは、AIが人間のような自然な音声を生成・読み上げる「CoeFont STUDIO」を2021年4月にリリース。30文字までのテキストなら誰でも気軽に音声合成を試せるサイトを公開しています(期間限定)。
他にも、短い動画とテキストデータから長尺の講義動画を生成するAIの登場や、文字などを読むことが困難な人のための国際標準規格DAISYに準拠したデジタル録音図書など音声合成技術は急速に進化中。その中でも課題のひとつとされていた「誤読」「イントネーション間違い」「話す間」などを改善する今回のAIシステムは、この領域で一線を画すものとなるかもしれません。
大日本印刷株式会社
(文・Higuchi)
外部リンク
この記事に関連するニュース
-
「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術
ASCII.jp / 2024年7月19日 10時0分
-
AIが誤変換する鹿児島弁、速記が頼り…鹿児島県議会事務局「AIにはまだ難しい」
読売新聞 / 2024年7月17日 16時4分
-
LegalOn TechnologiesがAI開発支援事業を開始、法務業務以外にも対応可能
マイナビニュース / 2024年7月12日 16時12分
-
米TrilloがAI文書管理システム発表|検索やQ&A、文書比較でタスクを自動化
Techable / 2024年6月25日 18時0分
-
rinna、AI音声合成サービスKoemotionをアップデート
PR TIMES / 2024年6月24日 15時45分
ランキング
-
1「会社のWindows PCが突如ブルースクリーンに……」 世界中で報告相次ぐ 「仕事ができない」
ITmedia NEWS / 2024年7月19日 14時49分
-
2札幌市イオンモールの駐車場が子育て世代に優しいと話題 気遣いの“言葉”に「これ素敵すぎる」「涙が出ちゃった」と称賛の声
ねとらぼ / 2024年7月18日 8時0分
-
3サイバー攻撃による流出情報元に「突撃取材するのはやめて」 ニコニコ運営代表が新聞社に警告、記者名も把握
J-CASTニュース / 2024年7月18日 19時35分
-
4Type-Cケーブル1本で、4K映像を2画面出力できる!ドッキングステーション
ITライフハック / 2024年7月19日 11時0分
-
5コンテンツサービスで相次ぐ突然のクレカ決済停止の問題点 今後どう対応できるのか、議員と弁護士に聞いた
ねとらぼ / 2024年7月19日 12時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください