認識率が大幅向上、エラー改善率最大20%を記録。ディープラーニングの発展技術「LSTM」を実装し、音声認識エンジンAmiVoice(R)が更に精度向上しました
PR TIMES / 2017年11月15日 12時1分
株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、ディープラーニングの発展技術であるリカレントニューラルネットワークの「LSTM(Long Short-Term Memory)」を音声認識エンジンAmiVoiceに実装しました。これにより、エラー改善率最大20%を記録(当社調べ)し、自然発話の認識率が大きく向上いたしました。
LSTMは、リカレントニューラルネットワーク技術の一つで、これまで短期でしか利用できなかった情報を長期に渡って活用することができるという特徴を持っています。これを音声認識エンジンに実装することで認識率を向上させることが可能となりました。
この度、音声認識エンジンAmiVoiceの音響モデル、発話区間検出にLSTM技術を実装しました。過去の情報を加味しながら処理を行うことで、特に話し言葉を中心とした自然発話の認識率が大きく向上し、従来型のDNN技術と比較しエラー改善率最大20%を記録しました。加えて、精度への影響を抑えつつフレームレート(認識処理の単位)を小さくする手法を導入することで、従来のLSTM技術で課題となっていた処理速度の問題を解決し、高い認識速度を保ちながら精度向上を実現しました。発話区間検出にもLSTM技術を実装したため、発話の区間判断の精度と耐雑音性能が向上しました。
[画像: https://prtimes.jp/i/20223/55/resize/d20223-55-814227-0.jpg ]
まずは自然発話が中心となる、議事録やコールセンター分野から導入をスタートし、順次各サービスへの実装する予定です。
アドバンスト・メディアでは、今後も継続的に技術開発を進め、お客様の業務の効率化・価値創造に貢献するソリューションやサービスの提供に努めてまいります。
以上
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
コンタクトセンター向け音声認識ソリューション「AmiVoice(R) Communication Suite」、コムデザインのクラウド型CTI「CT-e1/SaaS」とAPI連携開始
PR TIMES / 2024年4月16日 14時45分
-
Qiita記事投稿キャンペーン「音声認識APIを使ってみよう!」を開催
PR TIMES / 2024年4月10日 14時45分
-
【オンラインセミナー】開発者向け:これだけは押さえたい!音声認識導入で失敗しないシステム開発のノウハウ(1)ー要件定義とUI・UX編ー【4月24日(水)開催】
PR TIMES / 2024年4月9日 15時15分
-
音声認識API「AmiVoice(R) API」がAWS ファンデーショナルテクニカルレビューを通過し、「AWS認定ソフトウェア」になりました
PR TIMES / 2024年4月3日 13時45分
-
AI音声対話アバター「AI Avatar AOI」のシステムで実現 上士幌町の自動運転バスに、AI車掌が自治体初(※1)導入
PR TIMES / 2024年3月28日 14時15分
ランキング
-
1【解説】円安どこまで進む? 深刻…家計にも影響、為替介入の可能性は
日テレNEWS NNN / 2024年4月25日 20時5分
-
2英郵便局の冤罪事件、会計システム原因の富士通社長「申し訳ない」と謝罪…1月にドラマ化され批判強まる
読売新聞 / 2024年4月25日 23時0分
-
3なぜ歯磨き粉はミント味? ヒット商品の誕生には「無駄」が必要なワケ
ITmedia ビジネスオンライン / 2024年4月26日 8時0分
-
4米、為替介入に慎重姿勢 財務長官「行うのはまれ」
共同通信 / 2024年4月26日 0時19分
-
5サイゼリヤ、ギリギリ「国内黒字化」も残る難題 国内事業の利益率0.05%、値上げなしで大丈夫か
東洋経済オンライン / 2024年4月24日 7時30分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください