雑音環境での音声感情認識技術を開発
PR TIMES / 2018年5月8日 16時1分
~こころに寄り添うカーインフォテイメントの実現に向けて~
株式会社Empath(以下Empath)と株式会社NTTドコモ(以下ドコモ)は、雑音環境での音声感情認識技術(以下、本技術)を2018年3月に共同で開発いたしました。
2018年度に本技術をAIインフォテイメントサービス*1に導入することをめざします。
本技術は、NTTグループのAI「corevo(R)」*2を構成するドコモ独自の音声感情認識技術とEmpathの音声感情解析AI「Empath」の技術をもとに開発しました。本技術を用いて自動車とドライバーを感情によって結びつけることで、ドライバーが自動車に愛着をもって楽しく運転したり、運転に集中して居眠り運転の解消などに貢献できると考えています。2017年11月から2018年3月までの間、ドコモとEmpathは、走行雑音がある環境で音声による感情推定の認識率向上の取り組みを行いました。その結果、停車中のような雑音が小さい条件から高速道走行中のように大きな走行雑音がある条件において、自然に発声された対話音声*3の「怒り」「喜び」「悲しみ」の感情の認識を従来60%程度*4のところ、業界で最高水準の高い平均正答率*5となる75%で実現しました。
また、AIが感情を理解して感情にあわせた声かけを行うことで、ドライバーの眠気やだるさなどの倦怠感を表す指標値が50%減少し、被験者の93%はAIが自分の気持ちに寄り添ってくれていると感じて、気分良く運転できることを実証実験にて確認いたしました。
これにより、安心・安全な運転に貢献し、自動車に愛着が生まれるような新たなサービスの創出に取り組んでまいります。
なお、音声による感情認識技術を活用したAIインフォテイメントサービスのコンセプトは、2018年5月9日(水)から11日(金)まで東京ビッグサイトで開催される「2018 Japan IT Week」内「IoT/M2M展」の会場内ドコモブースのAIインフォテイメントコーナーで、デモをご覧いただける予定です。
*1ドコモが提供する自動車向けの音声エージェントサービス。
*2「corevo」は、日本電信電話株式会社の登録商標です。(http://www.ntt.co.jp/corevo/)
*3発話者が特定の感情の音声を意図的に発声しようとせずに自然に発声された音声。
*4ドコモの調べに基づく。
*5ある感情の音声に対してその感情の音声であると正しく認識できる確率。
開発技術の概要
1. 技術概要
認識対象の音声に対して声の高さや音色などの音響的な特徴を分析し、あらかじめ機械学習で生成しておいた感情認識モデルを用いて、音響的な特徴からどの感情の音声であるかを推定します。走行時の自動車のエンジン音等の特徴を取り入れた認識モデルの生成技術により、停車中を想定した雑音が小さいSNR(Signal to Noise Ratio:信号対雑音比)が15dB以上の条件から、高速道路走行中を想定した雑音が大きいSNRが0dBの条件において、「怒り」「喜び」「悲しみ」の3感情の平均正答率75%を実現しました。
[画像1: https://prtimes.jp/i/30514/4/resize/d30514-4-837894-0.jpg ]
図:音声感情認識のしくみ
2.各社の役割
<Empath>
・入力された音声に感情が込められているかを判定し、明確に感情が表れている音声を正しく認識して誤認識を抑える技術の提案。
<ドコモ>
・雑音が小さい環境(停車時)から大きい環境(高速道走行時)の条件で、自然に発声された音声の感情を正しく認識する技術の提案。
・両社提案技術を組み合わせる方法の考案。
実証実験の概要
●実施者:ドコモ、Empath社
●実験日程:2018年2月10日~3月27日
●被験者数:60名 (男性30名、女性30名、平均年齢:41歳)
●目的:感情を考慮したAIの発話による利用者の感情状態に対する影響の検証
●実験詳細:
・乗車時の環境を模したシミュレータに音声エージェントアプリを設置し、被験者の感情状態に合わせて適切な対話スクリプトを用意し、アプリによる介入前後での感情状態の変化を計測。
・対話スクリプトは精神科医、臨床心理士等の監修のもと、ポジティブ心理学や認知行動療法のメソッドを用いて気分を快にするスクリプトを作成。・感情状態の変化の計測には、妥当性検証済の心理尺度アンケート等を利用し、効果を測定。
[画像2: https://prtimes.jp/i/30514/4/resize/d30514-4-785173-1.jpg ]
図:カーシミュレータにて被験者がアプリを操作
●実験結果:
・本実験により感情を考慮した音声エージェントアプリによる介入によって、被験者に対していくつかの感情の変化を起こすことに成功。
・一例として、感情を考慮したアプリの介入により、感情・覚醒の度合いを示すアラウザルチェックの眠気や倦怠感を示す値が有意に低下。感情を考慮しないアプリの場合では眠気や倦怠感は有意に変化しなかった。
・感情を考慮したアプリの介入によって気分がよくなり、倦怠感が低下しドライバーが覚醒したと
考えられる。
・その他にも楽しい気分の持続や悲しい気分の低下を確認。
【参考】
<会社情報>
会社名
株式会社NTTドコモ
代表者
代表取締役 社長 吉澤 和弘
所在地
東京都千代田区永田町2-11-1 山王パークタワー
資本金
9,496億7,950万円(2017年3月31日時点)
営業開始
1992年7月1日
従業員数
7,609名(当社グループ26,734名)(2017年3月31日時点)
事業内容
・モバイル通信事業
・スマートライフ事業
******************************************************
会社名
株式会社Empath
代表者
代表取締役 下地 貴明
所在地
東京都渋谷区神宮前6丁目18-13 神宮前浅間ビル7F
営業開始
2017年10月31日
事業内容
音声感情解析AI「Empath」の開発および販売
企業プレスリリース詳細へ
PR TIMESトップへ
この記事に関連するニュース
-
商談解析AI「JamRoll」、ロゴデザインをリニューアル
PR TIMES / 2024年4月19日 13時15分
-
「ゆらぎ」で疲れない体を手に入れる…自律神経が整えられる
日刊ゲンダイ ヘルスケア / 2024年4月12日 9時26分
-
韓国の研究者が進める「偽の声を区別する」研究…AIディープボイス、犯罪に対抗「新技術」
KOREA WAVE / 2024年4月11日 9時0分
-
クロスキャット、クラウド勤怠管理システム「CC-BizMate」ユーザー会「Mateカンファレンス」開催
PR TIMES / 2024年3月28日 18時40分
-
IEEEメンバーが提言 アフェクティブ コンピューティングの専門家 はこだて未来大学システム情報科学部 角 薫 教授
@Press / 2024年3月28日 14時30分
ランキング
-
1【速報】1ドル=155円を突破 円安止まらず 日米金利差「縮まらない」見方から円売り・ドル買い強まる
TBS NEWS DIG Powered by JNN / 2024年4月24日 21時19分
-
2サイゼリヤ、ギリギリ「国内黒字化」も残る難題 国内事業の利益率0.05%、値上げなしで大丈夫か
東洋経済オンライン / 2024年4月24日 7時30分
-
3山手線沿線の再開発が進む 「新宿、渋谷、品川」駅の工事はいつ終わるのか
ITmedia ビジネスオンライン / 2024年4月25日 7時10分
-
4目印は「エコだ値」シール、セブン-イレブン“見切り品”値引き拡大へ 食品ロス削減へ…客「貢献できて嬉しい」【Nスタ解説】
TBS NEWS DIG Powered by JNN / 2024年4月23日 20時0分
-
5過度の変動望ましくない、動向注視し万全の対応行う=円安で官房長官
ロイター / 2024年4月25日 11時35分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください