オトバンク、PKSHA Technologyの技術を活用したAI音声合成サービスを開始
PR TIMES / 2021年7月14日 18時45分
自然な発音を再現するアクセント推定技術を初の実用化
日本最大級の音声配信サービス「audiobook.jp」を運営する株式会社オトバンク( 本社:東京都文京区、代表取締役社長:久保田裕也、以下「オトバンク」)は、株式会社PKSHA Technology(本社:東京都文京区、代表取締役:上野山勝也、以下「PKSHA」)の音声関連技術をもとに、急激な需要拡大が見込まれるコンテンツの音声化に対応すべく、独自のAI音声合成サービス「カタリテ」を開発したことを発表します。本サービスでは、PKSHAが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を初めて実用化いたしました。また、『日経電子版』と連携して、活字コンテンツの音声化に関する実証実験を行います。
[画像1: https://prtimes.jp/i/34798/140/resize/d34798-140-f30f484a09a266e012ff-0.png ]
AI音声合成サービス「カタリテ」について
本サービスは、PKSHAの開発する最先端の音声合成技術に、オトバンクの保有するオーディオブック音声データベースを学習させることで実現したAI音声合成サービスです。音声合成技術を活用して、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツも適時に音声化し提供できる環境の実現を目指します。
▼「カタリテ」を活用して本プレスリリースを音声化しました。
[動画1: https://www.youtube.com/watch?v=O1xudwxGLX8 ]
<「カタリテ」の特徴>
・独自の音声関連技術に強みを持つPKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」を採用。さらにオトバンクのオーディオブックディレクターがチューニングを実施することで、より自然で聴き心地のいい音声を実現しています。
・「PKSHA Phonetics(フォネティクス)」独自のアクセント推定技術「tdmelodic」(※)等により、一般的な音声合成ソフトウェアでは難しいアクセントの制御が可能。「tdmelodic」を導入したサービスの実用化は、今回が初の取り組みです。
※PKSHAは独自の波形特徴量生成技術「DCTTS」やアクセント推定技術「tdmelodic」を音声領域でのトップ学会の一つであるICASSPで発表するなど、音声分野にて最先端のアルゴリズムを開発しております。
https://prtimes.jp/main/html/rd/p/000000017.000022705.html
・オトバンクが制作したオーディオブックをデータベースとし、抑揚や音色も人が聞き取りやすく長時間聞いても疲れにくいようにチューニングを行っています。
・語り手(朗読者)には、アニメーション作品や報道番組のナレーションなど幅広い作品で活躍する人気声優の浅野真澄さんを起用。落ち着いた安定感のある声で音声化されます。
[画像2: https://prtimes.jp/i/34798/140/resize/d34798-140-0580aa88473320b4e242-1.png ]
<浅野真澄プロフィール>
秋田県出身。「浅野真澄」として声優業で活躍するほか、「あさのますみ」として文筆業でも活動している。出演作品:アニメ「Go!プリンセスプリキュア」(キュアマーメイド)、「PSYCHO-PASS」(青柳璃彩)、「一騎当千」(孫策伯符)、「GIANT KILLING」(永田有里)、「ハヤテのごとく!」(朝風理沙)他多数。TVナレーション「Nスタ」(TBS)、「クローズアップ現代+」(NHK)他多数。
なお、「カタリテ」は自社サービス内で活用することで、精度の向上を目指します。
音声合成サービス開発の背景
オトバンクは、本を耳でも聴ける世の中を実現したいという想いをもとに、創業以来オーディオブックを中心とした音声コンテンツの制作・配信を行ってまいりました。音声コンテンツのニーズは加速し、運営する音声配信サービス「audiobook.jp」は、2021年6月に会員数が200万人を突破するなどユーザー数が急速に伸長しています。
この度、加速する音声化のニーズに対応するべく、アルゴリズム領域の最先端技術の開発からその応用までをワンストップで行うPKSHAと連携し、オトバンクの膨大な音声データを活用しながらクオリティの監修に制作ディレクターが関わるなど、双方の強みをかけあわせたAI音声合成サービスを開発するに至りました。
■『日本経済新聞社』との実証実験について
オトバンクは、7月14日より、『日経電子版』と連携して本サービスの実証実験を開始しました。『日経電子版』の速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、オトバンクが運営する「audiobook.jp」の聴き放題プランにて配信します。
【『AIナレータが読む、日経電子版 きょうの速報ニュース』】
[画像3: https://prtimes.jp/i/34798/140/resize/d34798-140-851010e4d00ad5819789-2.png ]
・配信内容:AIナレーターのカタリテによる実証実験として、日経電子版で配信された速報ニュースの見出しを読み上げます。
・配信日:毎週月曜~金曜日の平日18時に更新します。
・配信場所:「audiobook.jp」聴き放題プランでの配信から開始。
「audiobook.jp」配信URL
https://audiobook.jp/audiobook/260919
▼『AIナレータが読む、日経電子版 きょうの速報ニュース』サンプル
[動画2: https://www.youtube.com/watch?v=1cpMeBPSIL8 ]
関係者からのコメント
・株式会社オトバンク代表取締役社長 久保田裕也
「私たちの制作におけるこだわりを、今回の技術でも反映させるべく、色々と調整を重ねてきました。その点に関してご理解くださり、協力くださった皆様にお礼申し上げます。今後も「聞き入る文化」の創造を目指し、「音のこだわり」をさまざまな観点から実現できる取り組みに挑戦します。」
・株式会社PKSHA Technology R&Dチーム 堅山耀太郎
「弊社は2016年頃から深層学習による音声分野の研究に取り組んでおり、継続的に音声分野でのトップ学会等に成果を発表するなど研究を進めてまいりました。今回これらの研究成果を生かした取り組みの一つとして、オトバンクとの協業が実現したことを大変うれしく思います。引き続き最先端のアルゴリズムの社会実装に取り組んでまいります。」
・日本経済新聞社 デジタル編成ユニット サービス開発グループ長 筧 尚武
「日経電子版では、読者のコンテキストに合わせた情報発信を常に模索しています。今回、音声化のノウハウを持つオトバンクさんと『見出しの読み上げ』に取り組みました。ニュースの見出しは短縮表現が多く、耳で伝えるためには工夫が必要でした。この自動処理の取り組みは、今後、見出しの自動翻訳や精度の高いタグ付けにも繋がると考えています。引き続き、耳で伝えるための技術研究に取り組む所存です。カタリテの音質改善にも大いに期待しています。」
今後の展開
「聴くも選べる時代へ」をコンセプトに、実証実験の状況に応じて、連携媒体を増やしていく予定です。今後も、あらゆるコンテンツをあらゆる場所で楽しめる未来の実現を目指し、音声に関する新たな取り組みを続けてまいります。
■株式会社オトバンク(本社:東京都文京区、代表取締役社長:久保田裕也)
音声コンテンツを中心とした事業を展開し、「聞き入る文化の創造」「目が不自由な人へのバリアフリー」「出版文化の振興」の達成を目指している、日本最大の配信数を誇るオーディオブックカンパニーです。500社以上の出版社様と提携し、主な事業として、日本最大のオーディオブック配信サービス「audiobook.jp」でのオーディオブック販売をはじめ、オンラインブックガイド「新刊JP」( http://sinkan.jp/ )を中心とした書籍のプロモーション事業も行っています。http://www.otobank.co.jp/
■株式会社PKSHA Technology(本社:東京都文京区、代表取締役 上野山 勝也)
「アルゴリズムサプライヤー」として、自社開発した機械学習/深層学習領域のアルゴリズムを用い、既存のソフトウェアや各種ハードウエア端末向けにソリューションを展開しています。伸長している領域としては、自然言語処理技術を用いた自動応答や、画像/動画認識、予測モデルなど多岐に渡ります。アルゴリズムを軸に近未来のデジタル情報社会へ向けて価値を創造すべく、今後も多種多様な企業・サービスとも連携を強め、積極的に事業展開しています。 https://pkshatech.com/ja/
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
【オーディオブック4月人気ランキング】日経平均4万円台を記録した3月、全米ベストセラーの話題作『JUST KEEP BUYING 自動的に富が増え続ける「お金」と「時間」の法則』が1位に浮上!
PR TIMES / 2024年4月8日 13時45分
-
【社会人514名に聞いた自己学習の習慣化に関する調査】 オーディオブック利用後「学習時間が増えた」は7割以上
PR TIMES / 2024年3月29日 12時45分
-
エレコム製品でスキマ時間をもっと有意義に!オーディオブック最大手※のオトバンクとの協業を開始。エレコムグループの製品購入で「ながら読書」30日無料体験が可能!
PR TIMES / 2024年3月21日 15時45分
-
新生活にエレコム製品で「耳活」をはじめよう! エレコム各店舗・webショップで製品ご購入の方にaudiobook.jp聴き放題プランを30日間無料で提供
PR TIMES / 2024年3月21日 15時15分
-
音声で熊本県菊池市の街歩きを楽しもう!「武光公の道連れ菊池さんぽ~いざゆかん!神助けの路~」をaudiobook.jpで3月21日より配信開始
PR TIMES / 2024年3月21日 14時0分
ランキング
-
1グリコ「チルド食品」出荷再開→再停止…システム障害で 乳製品・洋生菓子など、5月中旬の再開目指す【全文】
ORICON NEWS / 2024年4月19日 18時57分
-
2日本在留の外国人が日本で働きたくない理由 2位は「働く環境が悪い」、1位は?
ITmedia ビジネスオンライン / 2024年4月19日 17時15分
-
3東証、一時1300円安 大幅反落、2カ月ぶり安値水準
共同通信 / 2024年4月19日 12時5分
-
4東証大幅反落、終値1011円安 中東緊迫、3年2カ月ぶり下げ幅
共同通信 / 2024年4月19日 17時36分
-
5格安スマホの利用者は約4割 実際に支払っている月額利用料金の2位は「2000円台」、1位は?
ITmedia ビジネスオンライン / 2024年4月19日 17時15分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください