人間の脳と同じような音声情報処理を実現、NTTテクノクロスの「SpeechRec Server」新バージョン
週刊BCN+ / 2021年11月16日 16時0分
![人間の脳と同じような音声情報処理を実現、NTTテクノクロスの「SpeechRec Server」新バージョン](https://media.image.infoseek.co.jp/isnews/photos/weeklybcn/weeklybcn_187205_0-small.jpg)
記事の画像
NTTテクノクロスは、音声認識ソフトウェア「SpeechRec Server(スピーチレック サーバー)」の新バージョンを11月19日から販売する。SpeechRec Serverは、NTT研究所が新たに開発した音声音響処理、自然言語処理などの情報処理を人間の脳と同じようにオールインワンで可能にするAIを活用。これにより、高精度な音声認識を実現した。
SpeechRec Serverの新バージョンでは、NTTコンピュータ&データサイエンス研究所の次世代メディア処理AI「MediaGnosis」を活用した音声情報処理としてエンドツーエンド方式を採用。これまで一部の音声情報処理のみに適用していたディープニューラルネットワーク(DNN)を全てに適用し、音声データ入力からテキスト出力までをオールインワンで実現している。
MediaGnosisにより、相づちや「えー」「あのー」などのつなぎ言葉に加え、「私なんかは」などの話し言葉特有の表現を認識し、話の意味を理解しやすいようなテキストに変換。また、テキスト化された情報を内容ごとに分類して表示することもできる。複数の人が話す場合、それぞれを識別するために事前に音声を登録したり、マイクを分けたりする必要がなく、話者の声質や波形などの特徴からMediaGnosisが自動で話者を識別する。
外部リンク
この記事に関連するニュース
-
rinna、AI音声合成サービスKoemotionをアップデート
PR TIMES / 2024年6月24日 15時45分
-
フェアリーデバイセズ、ISMS認証(ISO/IEC 27001)ならびにISMSクラウドセキュリティ認証(ISO/IEC 27017)を取得
PR TIMES / 2024年6月20日 11時15分
-
リアルタイム低遅延ボイチェンのポイントは“個性の制限”? NTTが研究成果を発表する「オープンハウス」が6月24日から大阪で開催
ITmedia PC USER / 2024年6月19日 6時0分
-
声と話し方を好みのスタイルに一瞬で変える ~高音質かつ低遅延なリアルタイム音声変換~
Digital PR Platform / 2024年6月17日 10時0分
-
Claris、「Claris FileMaker 2024」を提供開始
マイナビニュース / 2024年6月5日 16時34分
ランキング
-
1ソニー宮城拠点、250人削減=ブルーレイ、生産縮小
時事通信 / 2024年6月29日 15時49分
-
2「クレカタッチ」は交通系ICカードを駆逐するのか 熊本で「全国相互利用」離脱、一方で逆の動きも
東洋経済オンライン / 2024年6月29日 7時30分
-
3「押しボタン式信号」なぜ“押してすぐ青”にならないケースが? 納得の理由があった!
乗りものニュース / 2024年6月29日 16時42分
-
4作文は「理系だと苦手」「文系が得意」という大誤解 算数が得意な子は大概「作文もうまい」納得理由
東洋経済オンライン / 2024年6月29日 10時0分
-
5池袋西武とヨドバシ「売り場折半」の波紋と懐事情 北側にヨドバシ出店、西武の集客力に影響は?
東洋経済オンライン / 2024年6月29日 10時30分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)