大規模言語モデルに個人の発話を効率よく再現させる個人性再現対話技術を開発 ~NTT版LLM”tsuzumi”への適用により、本人のデジタル分身を低コストに生成可能~
Digital PR Platform / 2024年1月17日 15時6分
NTT(本社:東京都千代田区、代表取締役社長:島田 明)は、IOWN構想の柱の1つであるデジタルツインコンピューティング(以下、DTC) (※1)において、物理世界の制約を超えた活動や交流を通した機会増大や自己成長の実現を目指し、本人のように行動し本人と経験を共有する分身のようなAIエージェント「Another Me(R)」の研究開発を進めています。今回、NTT版大規模言語モデル「tsuzumi」(※2)の拡張技術として、少量の対話データから個人の口調や発話内容の特徴を反映して対話を生成する個人性再現対話技術を開発しました。また、少量の音声データから個人の声色を反映した音声を合成するZero/Few-shot音声合成技術を開発しました。従来、個人の特徴を学習し再現するには個人に関するデータが大量に必要だったのに対し、少量データから再現可能になったことで、多くの人が誰でも簡単にデジタル空間内に自身の分身を持つことが可能となります。本研究成果の実用化に向けて、自分自身に代わって人とのコミュニケーションやコミュニティ活動などを行うデジタル分身の公開実証等を進めていきます。
1.背景
社会全体のデジタル化やAI技術の発展に伴い効率的な生活が実現されていく一方で、汎用AIのようなあらゆる問題に画一的な答えを出すAIへの過度な依存により、個人や社会の多様性が損なわれる可能性も指摘され始めています。こうしたなかNTTでは、IOWN構想において人それぞれが多様な個性を自然に発揮できる社会の実現を目指しており、専門性や個性を備えた比較的小規模なAIの集合知による多様性の確保を方針としてNTT版大規模言語モデル「tsuzumi」の研究開発を進めてきました。さらに、人の多種多様な個性を学習し人の代わりに自律的に活動するAIにより、人の多様性を様々な社会・経済活動に反映していくAnother Meプロジェクトを推進しています。本プロジェクトにおいて、昨年度は「過去の行動からその人が持つ趣味、価値観などを推定する個人性抽出技術」や「プロフィールや属性からその人らしい対話を再現する個人性再現対話技術」の開発(※3)を行いました。今回、Another Meの社会実装をさらに進めるため、大規模言語モデル(LLM: Large Language Model)を対話に適用し、さらに、少量のデータからでも高い本人再現性を実現する技術を開発しました。
この記事に関連するニュース
-
太陽生命とNTT Com、生成AIを活用したアバターによる生命保険募集の共同実証実験を実施
@Press / 2024年4月30日 10時0分
-
株式会社FIXER、生成AIプラットフォーム「GaiXer」に Anthropic社の最上位LLM「Claude 3 Opus」を搭載
PR TIMES / 2024年4月19日 19時15分
-
「exaBase 生成AI」が複数の大規模言語モデルに対応、LLM間の切り替え利用を最適化する特許を取得
PR TIMES / 2024年4月16日 18時15分
-
NTTがLLMで文書画像を視覚的に読解する技術を開発 - tsuzumiに搭載し展開も
マイナビニュース / 2024年4月12日 12時14分
-
LLMによる視覚読解技術を確立 ~グラフィカルな文書を理解する「tsuzumi」実現に向けて~
Digital PR Platform / 2024年4月12日 0時0分
ランキング
-
1日銀がこれほどまで円安を「無視」する3つの理由 「為替は管轄外」では、結局うまくいかない?
東洋経済オンライン / 2024年5月4日 9時30分
-
224年度の企業倒産、1万件超か 原材料高、人手不足が収支圧迫
共同通信 / 2024年5月4日 15時30分
-
3相鉄線「屈指の閑散駅」ついに一新へ! 大幅イメチェン&新改札も 完成時期は?
乗りものニュース / 2024年5月4日 8時42分
-
4箱根にフロントもない「無人ホテル」開業 〝不便さ〟感じる? 記者が体験してみた
カナロコ by 神奈川新聞 / 2024年5月4日 18時38分
-
5過度な動き「ならす必要も」=円安、介入コメントせず―鈴木財務相
時事通信 / 2024年5月3日 23時51分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください