人間の脳と同じような音声情報処理を実現、NTTテクノクロスの「SpeechRec Server」新バージョン
週刊BCN+ / 2021年11月16日 16時0分
記事の画像
NTTテクノクロスは、音声認識ソフトウェア「SpeechRec Server(スピーチレック サーバー)」の新バージョンを11月19日から販売する。SpeechRec Serverは、NTT研究所が新たに開発した音声音響処理、自然言語処理などの情報処理を人間の脳と同じようにオールインワンで可能にするAIを活用。これにより、高精度な音声認識を実現した。
SpeechRec Serverの新バージョンでは、NTTコンピュータ&データサイエンス研究所の次世代メディア処理AI「MediaGnosis」を活用した音声情報処理としてエンドツーエンド方式を採用。これまで一部の音声情報処理のみに適用していたディープニューラルネットワーク(DNN)を全てに適用し、音声データ入力からテキスト出力までをオールインワンで実現している。
MediaGnosisにより、相づちや「えー」「あのー」などのつなぎ言葉に加え、「私なんかは」などの話し言葉特有の表現を認識し、話の意味を理解しやすいようなテキストに変換。また、テキスト化された情報を内容ごとに分類して表示することもできる。複数の人が話す場合、それぞれを識別するために事前に音声を登録したり、マイクを分けたりする必要がなく、話者の声質や波形などの特徴からMediaGnosisが自動で話者を識別する。
外部リンク
この記事に関連するニュース
-
AI時代の新潮流! 音声×AIがもたらすビジネス革命 第2回 録音ファイルから音声データへ。企業成長を加速する音声のデータ化とは?
マイナビニュース / 2024年11月22日 17時0分
-
ライトアップ、PKSHA Technologyグループ各社と提携し、中小企業向けAIソリューション拡販で協業開始
PR TIMES / 2024年11月19日 15時15分
-
【業界初】AI議事録ツールSecureMemoCloudが、会議音声からほぼ完成版の議事録をAI自動作成する機能を提供
PR TIMES / 2024年11月9日 22時40分
-
新たなコンタクトセンターシステム導入によるお客さま利便性の向上
PR TIMES / 2024年11月9日 13時40分
-
【東芝デジタルソリューションズ】RECAIUS音声合成ミドルウェア「ToSpeak」のハイエンド機器向けラインアップを強化
Digital PR Platform / 2024年11月6日 11時27分
ランキング
-
1関西財界訪中団、邦人の安全確保に懸念 短期ビザ免除再開に期待も 投資意欲は持続
産経ニュース / 2024年11月25日 18時19分
-
2「トイレ流せない…」水道代にも値上げの波 千葉で水道代を2割“値上げ”方針 住民からは悲鳴も【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2024年11月25日 21時9分
-
3トヨタ、北京の営業拠点閉鎖 中国合弁、天津に集約へ
共同通信 / 2024年11月25日 20時22分
-
4災害に備えて家に食料を蓄えていますが、出先の対策が全くできていません…。普段から何を持ち歩けばよいでしょうか?
ファイナンシャルフィールド / 2024年10月24日 3時50分
-
5〈サイゼリヤのメニューに異変?〉「値上げして良いからメニューを充実させて」との不満投稿に広報の回答は?
集英社オンライン / 2024年11月25日 17時44分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください