レブコム、感情情報を音声データに自動付与する手法を開発 音声信号処理の国際学会で論文採択
OVO [オーヴォ] / 2024年4月8日 9時0分
RevComm(レブコム、東京都渋谷区)は、同社で研究開発を担うレブコム・リサーチ(RCR)の論文「大規模言語モデルを活用した音声への感情のアノテーション」が、音声・音響信号処理分野の世界最大規模の国際学会「ICASSP 2024」(4月14~19日、韓国・ソウル)で採択された、と発表した。
通常、感情情報を「アノテーション(注釈を付与)」するには、人手によって音声を聞き、感情を特定してタグ付けしなければならない。多大なコストがかかり、大規模な感情情報付きの音声データを作成するのは非常に困難だ。
RCRの研究は、音声書き起こしと音声的特徴を基に感情を大規模言語モデルを活用して自動的に付与する手法を提案している。RCRが行った実験で、大規模言語モデルは、人手と同程度の精度で感情を推定することができたという。
今回の成果によって、大規模な音声感情データの作成が容易になり、さらに高精度の音声感情認識器の開発が期待される、としている。
外部リンク
この記事に関連するニュース
-
オルツ、数兆パラメータ規模の大規模言語モデル構築に着手
PR TIMES / 2024年4月26日 17時15分
-
オルツ、数兆パラメータ規模の大規模言語モデル構築に着手
共同通信PRワイヤー / 2024年4月26日 15時0分
-
身体性の有無による人間と機械の言語処理プロセスの違いの解明に向けたオノマトペ音象徴性の分析を行った論文が「2024年度 人工知能学会全国大会」にて発表採択
PR TIMES / 2024年4月24日 13時15分
-
生成AI時代のデマ・フェイク問題、SNSの安全性を取り戻すには?
ASCII.jp / 2024年4月24日 11時0分
-
LLMによる視覚読解技術を確立 ~グラフィカルな文書を理解する「tsuzumi」実現に向けて~
Digital PR Platform / 2024年4月12日 0時0分
ランキング
-
1日本の名目GDP、2025年にインドに抜かれ世界5位へ…円安でドル換算が目減り
読売新聞 / 2024年5月5日 18時59分
-
2相鉄線「屈指の閑散駅」ついに一新へ! 大幅イメチェン&新改札も 完成時期は?
乗りものニュース / 2024年5月4日 8時42分
-
3投資家・バフェット氏、AIによる詐欺「史上最高の成長産業になる」…皮肉を込め警鐘
読売新聞 / 2024年5月5日 19時57分
-
4低所得国支援に1620億円 鈴木財務相、ADB総会誘致表明
共同通信 / 2024年5月5日 22時51分
-
5「週5日労働がふつう」は大間違いである…仕事でへとへとになってしまう人に決定的に欠けている視点
プレジデントオンライン / 2024年5月5日 15時15分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください