1. トップ
  2. 新着ニュース
  3. 経済
  4. プレスリリース

オトバンク、PKSHA Technologyの技術を活用したAI音声合成サービスを開始

PR TIMES / 2021年7月14日 18時45分

自然な発音を再現するアクセント推定技術を初の実用化

日本最大級の音声配信サービス「audiobook.jp」を運営する株式会社オトバンク( 本社:東京都文京区、代表取締役社長:久保田裕也、以下「オトバンク」)は、株式会社PKSHA Technology(本社:東京都文京区、代表取締役:上野山勝也、以下「PKSHA」)の音声関連技術をもとに、急激な需要拡大が見込まれるコンテンツの音声化に対応すべく、独自のAI音声合成サービス「カタリテ」を開発したことを発表します。本サービスでは、PKSHAが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を初めて実用化いたしました。また、『日経電子版』と連携して、活字コンテンツの音声化に関する実証実験を行います。



[画像1: https://prtimes.jp/i/34798/140/resize/d34798-140-f30f484a09a266e012ff-0.png ]



AI音声合成サービス「カタリテ」について

本サービスは、PKSHAの開発する最先端の音声合成技術に、オトバンクの保有するオーディオブック音声データベースを学習させることで実現したAI音声合成サービスです。音声合成技術を活用して、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツも適時に音声化し提供できる環境の実現を目指します。

▼「カタリテ」を活用して本プレスリリースを音声化しました。

[動画1: https://www.youtube.com/watch?v=O1xudwxGLX8 ]



<「カタリテ」の特徴>
・独自の音声関連技術に強みを持つPKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」を採用。さらにオトバンクのオーディオブックディレクターがチューニングを実施することで、より自然で聴き心地のいい音声を実現しています。

・「PKSHA Phonetics(フォネティクス)」独自のアクセント推定技術「tdmelodic」(※)等により、一般的な音声合成ソフトウェアでは難しいアクセントの制御が可能。「tdmelodic」を導入したサービスの実用化は、今回が初の取り組みです。

※PKSHAは独自の波形特徴量生成技術「DCTTS」やアクセント推定技術「tdmelodic」を音声領域でのトップ学会の一つであるICASSPで発表するなど、音声分野にて最先端のアルゴリズムを開発しております。
https://prtimes.jp/main/html/rd/p/000000017.000022705.html

・オトバンクが制作したオーディオブックをデータベースとし、抑揚や音色も人が聞き取りやすく長時間聞いても疲れにくいようにチューニングを行っています。

・語り手(朗読者)には、アニメーション作品や報道番組のナレーションなど幅広い作品で活躍する人気声優の浅野真澄さんを起用。落ち着いた安定感のある声で音声化されます。
[画像2: https://prtimes.jp/i/34798/140/resize/d34798-140-0580aa88473320b4e242-1.png ]


<浅野真澄プロフィール>
秋田県出身。「浅野真澄」として声優業で活躍するほか、「あさのますみ」として文筆業でも活動している。出演作品:アニメ「Go!プリンセスプリキュア」(キュアマーメイド)、「PSYCHO-PASS」(青柳璃彩)、「一騎当千」(孫策伯符)、「GIANT KILLING」(永田有里)、「ハヤテのごとく!」(朝風理沙)他多数。TVナレーション「Nスタ」(TBS)、「クローズアップ現代+」(NHK)他多数。

なお、「カタリテ」は自社サービス内で活用することで、精度の向上を目指します。



音声合成サービス開発の背景

オトバンクは、本を耳でも聴ける世の中を実現したいという想いをもとに、創業以来オーディオブックを中心とした音声コンテンツの制作・配信を行ってまいりました。音声コンテンツのニーズは加速し、運営する音声配信サービス「audiobook.jp」は、2021年6月に会員数が200万人を突破するなどユーザー数が急速に伸長しています。

この度、加速する音声化のニーズに対応するべく、アルゴリズム領域の最先端技術の開発からその応用までをワンストップで行うPKSHAと連携し、オトバンクの膨大な音声データを活用しながらクオリティの監修に制作ディレクターが関わるなど、双方の強みをかけあわせたAI音声合成サービスを開発するに至りました。

■『日本経済新聞社』との実証実験について
オトバンクは、7月14日より、『日経電子版』と連携して本サービスの実証実験を開始しました。『日経電子版』の速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、オトバンクが運営する「audiobook.jp」の聴き放題プランにて配信します。

【『AIナレータが読む、日経電子版 きょうの速報ニュース』】

[画像3: https://prtimes.jp/i/34798/140/resize/d34798-140-851010e4d00ad5819789-2.png ]

・配信内容:AIナレーターのカタリテによる実証実験として、日経電子版で配信された速報ニュースの見出しを読み上げます。
・配信日:毎週月曜~金曜日の平日18時に更新します。
・配信場所:「audiobook.jp」聴き放題プランでの配信から開始。
「audiobook.jp」配信URL
https://audiobook.jp/audiobook/260919


▼『AIナレータが読む、日経電子版 きょうの速報ニュース』サンプル

[動画2: https://www.youtube.com/watch?v=1cpMeBPSIL8 ]




関係者からのコメント

・株式会社オトバンク代表取締役社長 久保田裕也
「私たちの制作におけるこだわりを、今回の技術でも反映させるべく、色々と調整を重ねてきました。その点に関してご理解くださり、協力くださった皆様にお礼申し上げます。今後も「聞き入る文化」の創造を目指し、「音のこだわり」をさまざまな観点から実現できる取り組みに挑戦します。」

・株式会社PKSHA Technology R&Dチーム 堅山耀太郎
「弊社は2016年頃から深層学習による音声分野の研究に取り組んでおり、継続的に音声分野でのトップ学会等に成果を発表するなど研究を進めてまいりました。今回これらの研究成果を生かした取り組みの一つとして、オトバンクとの協業が実現したことを大変うれしく思います。引き続き最先端のアルゴリズムの社会実装に取り組んでまいります。」

・日本経済新聞社 デジタル編成ユニット サービス開発グループ長 筧 尚武
「日経電子版では、読者のコンテキストに合わせた情報発信を常に模索しています。今回、音声化のノウハウを持つオトバンクさんと『見出しの読み上げ』に取り組みました。ニュースの見出しは短縮表現が多く、耳で伝えるためには工夫が必要でした。この自動処理の取り組みは、今後、見出しの自動翻訳や精度の高いタグ付けにも繋がると考えています。引き続き、耳で伝えるための技術研究に取り組む所存です。カタリテの音質改善にも大いに期待しています。」


今後の展開

「聴くも選べる時代へ」をコンセプトに、実証実験の状況に応じて、連携媒体を増やしていく予定です。今後も、あらゆるコンテンツをあらゆる場所で楽しめる未来の実現を目指し、音声に関する新たな取り組みを続けてまいります。

■株式会社オトバンク(本社:東京都文京区、代表取締役社長:久保田裕也)
音声コンテンツを中心とした事業を展開し、「聞き入る文化の創造」「目が不自由な人へのバリアフリー」「出版文化の振興」の達成を目指している、日本最大の配信数を誇るオーディオブックカンパニーです。500社以上の出版社様と提携し、主な事業として、日本最大のオーディオブック配信サービス「audiobook.jp」でのオーディオブック販売をはじめ、オンラインブックガイド「新刊JP」( http://sinkan.jp/ )を中心とした書籍のプロモーション事業も行っています。 http://www.otobank.co.jp/

■株式会社PKSHA Technology(本社:東京都文京区、代表取締役 上野山 勝也)
「アルゴリズムサプライヤー」として、自社開発した機械学習/深層学習領域のアルゴリズムを用い、既存のソフトウェアや各種ハードウエア端末向けにソリューションを展開しています。伸長している領域としては、自然言語処理技術を用いた自動応答や、画像/動画認識、予測モデルなど多岐に渡ります。アルゴリズムを軸に近未来のデジタル情報社会へ向けて価値を創造すべく、今後も多種多様な企業・サービスとも連携を強め、積極的に事業展開しています。 https://pkshatech.com/ja/

企業プレスリリース詳細へ
PR TIMESトップへ

この記事に関連するニュース

トピックスRSS

ランキング