音声認識API「AmiVoice(R) API」にディープラーニング技術「Transformer」を実装。エラー改善率最大17%を達成し、認識率が大幅に向上しました。
PR TIMES / 2023年12月19日 13時45分
株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、12月13日(水)に、開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」にて提供している音声認識API「AmiVoice API」のほぼ全ての音声認識エンジンに、ディープラーニング技術「Transformer」を実装しました。
これによりエラー改善率が最大で17%(当社調べ)と、自然発話を中心とした認識率が大幅に向上しました。
https://acp.amivoice.com/amivoice_api/
「Transformer」は、ディープラーニングの発展技術の一つです。
従来の音声認識エンジンAmiVoiceに実装していた、「LSTM(Long Short-Term Memory)」や「Bi-LSTM(Bidirectional Long Short-Term Memory)」というリカレントニューラルネットワーク技術は、過去や未来の情報を記憶という形で取り入れ、現在の情報を計算していました。しかしこの記憶には、離れた時点の情報が残りにくいという課題がありました。
これに対し「Transformer」は、過去や未来の各時点の情報を直接、現在の情報に取り入れて計算を行います。そのため、長い入力の離れた時点の情報も効果的に利用でき、さらに高い認識率を実現することが可能です。
この度、「AmiVoice API」のほぼ全ての音声認識エンジンに「Transformer」を実装しました。「Bi-LSTM」を実装した音声認識エンジンと比較し、リアルタイム認識で最大17%、バッチ認識で最大13%のエラー改善率となり、認識率が大幅に向上しました。
「AmiVoice API」の全ラインアップ(同期HTTP音声認識API、非同期HTTP音声認識API、WebSocket音声認識API)でご利用可能です。
【「Transformer」を実装した音声認識エンジン】
[表1: https://prtimes.jp/data/corp/20223/table/465_1_adba383038b650d216242b1c1979772c.jpg ]
※電子カルテ_音声入力、中国語(8kHz/16kHz)、英語(8kHz)のエンジンはTransformerへアップデートしておりません。今後、随時アップデートを行います。
「AmiVoice API」の特長
1.音声認識市場シェアNo.1(※)。自然な話し言葉を高精度でテキスト化
25年以上のノウハウ・データが蓄積された高精度かつ高速のAI音声認識AmiVoiceを、サイトからすぐにお使いいただけます。全ての音声認識エンジン・感情解析オプションを毎月60分まで無料でご利用可能です。
2.低価格で高品質な音声認識を利用可能
録音された時間ではなく発話のあった時間のみの従量課金制。課金単位も1秒単位で切り上げ計算なし。業界最低価格でありながら高品質な音声認識エンジンを利用できます。
3.音声認識の専門家が開発を無償サポート
当社は、音声認識エンジンの開発からサービス提供まで全て自社で行っています。API導入時や、運用開始後のAPIに関する個別トラブルなどの技術的なお問い合わせに対しても、技術スタッフが直接、無償でサポートを行います。
4.業界や用途に合わせて選べるエンジンで高い認識率を実現
さまざまなシーンで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。利用シーンに合わせてエンジンを選ぶことで認識率が大幅に向上。
辞書登録機能を活用すれば、社内用語や固有名詞も高精度でテキスト化することが可能です。
5.サービス開発・運用は全て国内。セキュアな環境で利用可能
「AmiVoice API」は国内で開発・運用しています。お客様の音声データが海外へ出ることがないため、安心してご利用いただけます。
[画像: https://prtimes.jp/i/20223/465/resize/d20223-465-eee8faf671336af73b77-0.jpg ]
AmiVoice Cloud Platform
[表2: https://prtimes.jp/data/corp/20223/table/465_2_ae2739954b0562004112eedcaf373c72.jpg ]
※出典:合同会社ecarlate「音声認識市場動向2023」音声認識ソフトウェア/クラウドサービス市場
【本件のお問い合わせ】
株式会社アドバンスト・メディア
PF D&O部
MAIL:info@advanced-media.co.jp
https://www.advanced-media.co.jp/
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
建築工程管理プラットフォームサービス「AmiVoice(R) スーパーインスペクションプラットフォーム(仕上げ検査用)」が導入実績50,000ライセンスを突破
PR TIMES / 2024年7月17日 11時1分
-
建築工程管理プラットフォームサービス「AmiVoice(R) スーパーインスペクションプラットフォーム」音声認識エンジンを強化し、検査対象建築物の用途を拡大!
PR TIMES / 2024年6月25日 13時45分
-
会話解析ソリューション「AmiVoice(R) SF-CMS」の製品サイトをリニューアル
PR TIMES / 2024年6月21日 17時40分
-
比較資料「【最新版】音声認識API主要6社の価格・機能比較表 -失敗しないサービス選びのポイント-」を「AmiVoice(R) Cloud Platform」で公開
PR TIMES / 2024年6月21日 14時15分
-
【見逃し配信】開発者向け:これだけは押さえたい!音声認識導入で失敗しないシステム開発のノウハウ(1)ー要件定義とUI・UX編ー【6月18日(火)~7月31日(水)実施】
PR TIMES / 2024年6月18日 15時15分
ランキング
-
1マクドナルドが「ストローなしで飲めるフタ」試行 紙ストローの行方は...?広報「未定でございます」
J-CASTニュース / 2024年7月17日 12時55分
-
2申請を忘れると年金200万円の損…荻原博子「もらえるものはとことんもらう」ための賢者の知恵
プレジデントオンライン / 2024年7月17日 8時15分
-
3「再配達は有料に」 ドライバーの本音は
ITmedia ビジネスオンライン / 2024年7月17日 6時40分
-
4大谷翔平の新居「晒すメディア」なぜ叩かれるのか スターや芸能人の個人情報への向き合い方の変遷
東洋経済オンライン / 2024年7月16日 20時40分
-
5「根拠のない自信」持つ人に共通する"すごい特徴" 思考停止に陥る「3つのワナ」にはまらないコツ
東洋経済オンライン / 2024年7月17日 19時0分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)