手話者のアバター生成などに活用! 指先の動きまで認識できる3D姿勢推定技術
Techable / 2021年7月28日 14時0分
株式会社Preferred Networks(PFN)は、深層学習を活用して指先の向きや手の重なりなどを含む身体の動きを高精度に認識する3D姿勢推定技術を開発し、協業先を募集しています。
幅広い活用領域に期待!同技術は、3DCGによる人体シミュレーションで作成した大量の学習データをPFNのスーパーコンピュータに学習させることで実現しました。専用カメラによる撮影や身体へのセンサー装着は不要で、スマートフォンなどで撮影した動画でも身体細部の動きを高精度にトラッキングし、全身を総合的に認識できる高度な3D姿勢推定モデルです。これにより、従来課題となっていた指先の向きや両手が重なる場面などでの誤検出を大幅に削減できるといいます。
同技術は、これまでデジタル化が難しかった楽器演奏やスポーツの解析、細かな手作業の技術継承、遠隔診断・リハビリなどへの応用や、アバターアニメーション制作などの自動化が可能となるようです。
手話者のアバター動画を生成この3D姿勢推定技術は、ソフトバンク株式会社と国立大学法人電気通信大学が共同開発する、手話と音声による双方向コミュニケーションシステム「SureTalk」に採用されています。
「SureTalk」は、AIによって手話と音声をリアルタイムでテキストに変換し、画面を通して会話ができるWebツール。システムはコアエンジン部と手話データベース部で構成され、コアエンジン部には手話をテキスト化する「手話認識部」「自然言語処理部」と音声をテキスト化する「音声処理部」があります。これにより、手話者の動画から手話の意味を抽出し、時系列認識処理によって話者が表現している手話の単語順を認識したり、助詞の補完などで自然な日本語文に変換したり、音声をテキスト化したりできるというわけです。
「SureTalk」は、個人情報保護の観点から手話動画の匿名化を行います。そこで採用されたのがPFNの3D姿勢推定技術。映像上の手話者の手や指先の動きを正確に把握し、それに連動する3DCG(アバター動画)を自動生成することで、手話者のプライバシーを守ります。
株式会社Preferred Networks
(文・Higuchi)
外部リンク
この記事に関連するニュース
-
AI時代の新潮流! 音声×AIがもたらすビジネス革命 第2回 録音ファイルから音声データへ。企業成長を加速する音声のデータ化とは?
マイナビニュース / 2024年11月22日 17時0分
-
MCデジタル・リアルティのNRT12データセンターが、Preferred Networks のAI計算基盤に採用
共同通信PRワイヤー / 2024年11月19日 10時18分
-
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU
ASCII.jp / 2024年11月18日 12時0分
-
MCデジタル・リアルティのNRT12データセンターが、Preferred Networks のAI計算基盤に採用
PR TIMES / 2024年11月12日 15時15分
-
プログラミング教育HALLO(R) 馬事公苑に開校!世田谷初のYPスイッチフラッグシップ教室が誕生!
PR TIMES / 2024年11月12日 14時0分
ランキング
-
1「見た瞬間笑った」 共通テスト模試のリスニング問題 → “衝撃的なファッション”のイラストに思わず三度見 「肩ww」
ねとらぼ / 2024年11月26日 11時50分
-
2日本に1店舗のみの“完璧なマクドナルド”が778万表示の話題 地元民も「そんなすごい店やったんか…」「たまに使ってるけどそんなすげぇとこだったのね」
ねとらぼ / 2024年11月26日 7時40分
-
3東芝マテリアルを日本特殊陶業が買収 1500億円で
ITmedia NEWS / 2024年11月26日 12時44分
-
4『ドラクエ3』大魔王ゾーマ様、配信者になる―自己紹介では「嫌いなもの:ひかりのたま」とポロリ、「“ほりい”とかいう人間も泣き叫んでた」
インサイド / 2024年11月26日 13時10分
-
5スマホ料金「最激戦区の30GBプラン」を比較 ahamoショックにUQ mobileやY!mobileも追随でどこがお得に?
ITmedia Mobile / 2024年11月26日 6時5分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください