NICTと共同で総務大臣会見の文字起こしの自動化のためのプラットフォームをリリース
PR TIMES / 2021年7月7日 18時15分
~音声認識技術を活用した会見内容の自動作成・配信・デジタルデータ化で各省庁の会見テキスト化支援システムの構築を目指す~
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「フェアリーデバイセズ」)は、国立研究開発法人情報通信研究機構(本部:東京都小金井市、理事長:徳田 英幸、以下「NICT」)と共同で総務大臣会見文字起こしの自動化を行ったことをお知らせいたします。
実施概要
[画像: https://prtimes.jp/i/42518/31/resize/d42518-31-572b789e97086604c576-0.png ]
当社とNICTとの長年にわたる共同研究の成果を活用し、音声認識技術による総務大臣会見文字起こしの自動化のためのPF(プラットフォーム)をリリースいたしました。これによって、速記者の手作業よりも60-80%程度の文字起こし作業時間が短縮出来ることが確認されています。今後、確認・修正作業の改善を進めることで、さらなる効率化が期待されています。
当社は、2013 年より音声処理クラウドプラットフォーム「mimi(R)」を開発し、音声応用・音声対話システムを利用する企業向けに技術提供して参りました。また、2017年よりNICTの研究成果の社会実装を担い、mimi(R)においてNICT音声認識エンジン運用を可能とするとともに、11言語に対応した音声認識・翻訳・音声合成機能を有する多言語音声翻訳クラウドサービス「mimi(R)API Platform*1」も提供しております。また、2020年からは総務省から発表された「グローバルコミュニケーション計画2025」の推進のため、「多言語翻訳技術の高度化に関する研究開発*2」の中核メンバーとして「逐次通訳」の技術を「同時通訳」の技術にまで高度化しビジネス等の場面での利活用を目指しています。
これまでの大臣会見の文字起こし業務は、「録音した音声データを手作業で文字起こしし、人間による確認修正の上で公開する」もので、二段階に分けての人力でのアプローチによる所要時間の長さとヒューマンエラーの発生が課題視されていました。それらに対し当社のアプローチは、「録音したデータをmimi(R)を介してNICT音声認識エンジンでテキスト化することで自動化し、会見内容発信の手間とコストを大幅に削減する」ものです。なお、NICT音声認識エンジンはmimi(R)による辞書登録等の様々な現場状況に合わせた柔軟なチューニング機能に優れ、海外大手エンジンと比較して会見室や国会の環境においても相対的に高い音声認識精度を実現しています。これを実際に、アプリを作成し、総務大臣会見の文字起こしの自動化を検証しました。
今後、さらなる音声認識の精度向上やUIツールの継続的な機能改善によって、作業負荷の更なる低減と各種会見等での運用を目指すとともに、他省庁も含む記者会見の文字起こし自動化への展開を目指します。これによって、公務員の労働負荷を軽減しつつも、タイムリーかつ正確な情報開示による国民との対話とメディアリレーションの強化を実現する官公庁DXに取り組んで参ります。
注
(1) https://fairydevices.jp/mimi
(2) https://fo-pro.s3.ap-northeast-1.amazonaws.com/files/5f4d9fd796d52c59d4fd5ed2/gcp2025.pdf
mimi(R)︎ cloud API Serviceについて
様々なお客様が高度な音声対話システムを構築するための疎結合なソフトウェアスタックであり、マイクアレイ・フロントエンド処理機能を担う「mimi(R) XFE」、多言語音声認識及び翻訳機能を担う「mimi(R) ASR/TRA」、話者識別機能を担う「mimi(R) SRS」、環境音識別機能を担う「mimi(R) ESR」、音声合成機能を担う「mimi(R) TTS」等を有するクラウドAPIシステムです。「mimi(R) Cloud API Service 」利用製品は、累計200万台超に達し、多くの音声応用・音声対話システムを開発する企業にワンストップなソリューションとしてご活用頂いております。
詳細はこちら:https://fairydevices.jp/mimi
フェアリーデバイセズ株式会社について URL: https://fairydevices.jp/
フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」を目指し、VUI※1・VPA※2関連技術や音声認識/音声翻訳関連技術とクラウド基盤、それらの性能を活かすエッジデバイスの開発を通して、音声技術を中心とした機械学習技術の実業務現場への適用を推進して参りました。さらに、現場の人から生まれる各種のデータ解析や、それらに関わる最先端の応用研究を実装した業務ソリューションを、デバイスからクラウドまで一気通貫で提供することによって、様々な業界のデジタルトランスフォーメーションを支援しています。
※1 VUI:Voice User Interface / ※2 VPA:Voice Personal Assistant※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
ポケモンカードゲームの招待制自主大会 「KAMITOHITO INVITATIONAL 2024」にウェアラブルデバイスTHINKLETを提供します
PR TIMES / 2024年5月8日 16時45分
-
音声生成AIを提供する東大発スタートアップ企業の株式会社IZAI(イザイ)、コールセンター向け電話応対支援ソリューションの提供を開始
PR TIMES / 2024年4月30日 11時45分
-
DNP、音声をリアルタイムで表示するシステム開発 感情に合わせてフォントが変化
ITmedia ビジネスオンライン / 2024年4月25日 8時15分
-
感情に応じてフォントが変化 DNP、音声をリアルタイムでテキスト表示するシステム 窓口での案内などに
ITmedia NEWS / 2024年4月23日 17時34分
-
音声字幕・翻訳でコミュニケーションを円滑にする「対話支援システム」を提供開始
PR TIMES / 2024年4月23日 12時45分
ランキング
-
1コーヒー豆高騰の背景に…中国でブーム“悪魔のフルーツ”、ピザや火鍋にも【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2024年5月10日 21時10分
-
2「日本国債」の紙くず化がとまらない…雪だるま式「借金地獄」から日本が抜け出せない根本原因【経済のプロが解説】
THE GOLD ONLINE(ゴールドオンライン) / 2024年5月11日 11時15分
-
3朝ドラ登場の食堂モデル、岐阜の五平餅店が閉店へ…「寂しい」全国から名残惜しむファン足運ぶ
読売新聞 / 2024年5月10日 15時8分
-
4【閉園騒動から再出発】「ラブライブ!聖地」水族館、新社長が語った苦悩「従業員は大量解雇」「マイナスからのスタートです」
NEWSポストセブン / 2024年5月10日 19時20分
-
5ヨーカドーの跡地が「世界最大級の無印良品」に…過疎地の商業モールを復活させた「社会的品揃え」の魅力
プレジデントオンライン / 2024年5月11日 9時15分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください