産総研の最新AI研究状況を一挙公開!
ASCII.jp / 2025年2月7日 17時0分
「人間中心のAI技術研究」最新の成果
1月15日、産業技術総合研究所(産総研)の「実世界に埋め込まれる人間中心の人工知能技術の研究開発」事業の最終成果報告会が、東京国際交流館にて開催された。本事業は新エネルギー・産業技術総合開発機構(NEDO)の委託事業として、産総研人工知能研究センターが2020年から実施してきた。プロジェクトが最終年度を迎えたことを機に、その研究成果を報告する場として、報告会が開催された。
本事業は、「人と共に進化するAIシステムの基盤技術開発」と「容易に構築・導入できるAI技術の開発」の2つのテーマを掲げ、産総研人工知能研究センターを中心に国内外の大学・研究機関、企業、その他の公的機関が連携して大規模な研究開発を行ってきた。
冒頭の開会挨拶では、産総研情報・人間工学領域長の田中良夫氏が「実世界と密接に結びついたAI開発を進めることで、人間の生活や社会にどのように貢献できるかが重要である」と語った。AIの基礎研究だけでなく、社会や産業界が抱える課題の解決に向けた技術開発を目指している。
報告会では、前述の2つのテーマごとに各12テーマ、計24テーマのピッチトークが行われ、その後、ブース展示でデモやポスター発表が実施された。以下、最新のAI研究の成果を紹介する。展示されたテーマは以下の記事を参照。
産総研「実世界に埋め込まれる人間中心の人工知能技術の研究開発」最終成果報告会開催
AIの学習データ問題を解決するさまざまな手法
「画像基盤モデルを活用した医療画像診断支援システム」のブースでは、AIによる膀胱内視鏡診断のデモが行われていた。AIがリアルタイムで病変をマーキングし、医師の診断を補助するシステムだ。従来、AIの高精度な学習には何十万、何百万枚もの画像が必要とされてきたが、本研究では学習に使用した実際の内視鏡画像はわずか9,000枚だけで、高い精度を実現したという。鍵となるのが、大量の自動生成画像の活用である。
![](https://ascii.jp/img/2025/02/05/4159026/x/1e52a7571dfc5da5.jpg)
詳細を「数式ドリブン自動生成データセットに基づく事前学習モデル構築技術の開発」ブースで取材した。AI学習における課題としては、膨大な学習データの収集コストやアノテーション作業の労力・コスト、さらには権利侵害やレピュテーションリスク(著作権は問題なくとも、SNSで炎上するなど)もある。本研究では、数式(フラクタル幾何・輪郭形状)で自動生成された画像データを活用し、AIの事前学習モデルを構築することで、これらの課題を解決することを目指している。
数式で生成された画像で学習することによって、上記のような労力・コストや権利関係の課題は発生しない。計算資源さえあれば何十万枚でも、低コストで画像を生成できる。そして、その画像で学習させた基盤モデルに、前述のような膀胱内視鏡画像など、目的となる画像データを少量学習させるだけで、専門性の高いAIを開発できる。
![](https://ascii.jp/img/2025/02/05/4159027/x/508d6e87c01ff23a.jpg)
数式による生成画像での事前学習済み基盤モデルを義務教育を終えた大学生とすると、追加学習として専門的な教育を課し、医師のようなプロフェッショナルに育成するというイメージに例えられる。そして、追加学習は少量のデータでも十分な精度が得られるため、症例数が少ない希少疾患など、データが不足している分野にも対応できる。
加えて、この事前学習済みモデルは異なるデータ形式(画像・動画・音声・言語)を処理できるマルチモーダルAIとしての展開も可能であり、精度の面でも既存のImageNet(スタンフォード大学)やJFT-300M(Google)といったデータセットで学習したモデルに匹敵する結果を示している。
また、「人と共に進化するAIにおける視覚的説明と言語的説明技術の基盤開発」ブースでは、希少なデータで高精度なAIを実現するため、人の知見をモデルに組み込む手法が研究されていた。たとえば、珍しい難病の症例画像を学習させる際に、専門医が注目するポイントをモデルに組み込むことで、説明性と汎化能力の高いモデルが構築できる。デモでは、このAIモデルを活用した画像診断の学習アプリが展示されており、症例の少ない病気であっても見逃さないように訓練できる仕組みが紹介されていた。
音声AIでも基盤モデルによる新たなアプローチ
音声AIの分野でも、さまざまなアプローチが研究されている。「音響信号処理モデルの汎用化・適応化」ブースでは、日本語の音声・音響AIモデルを簡単に構築できる汎用基盤モデル(自己教師あり学習モデル)の開発・活用に関する研究が進められていた。この基盤モデルは、約60,000時間分のテレビ放送録画データをもとに構築されている。これを活用することで、少量のラベル付き日本語データを学習させるだけで、高精度な音声感情認識AIを開発できる。 キャプ)音声データでも、事前学習済みの基盤モデルを作成。適用先の現場の限られた量の音声データで追加学習することで、精度の高い音声AIを作成できる
![](https://ascii.jp/img/2025/02/05/4159029/x/f5a2e0878218c8ff.jpg)
従来、他言語での感情認識AIは存在していたが、日本語の感情認識は、日本語データを用いたモデルのほうが高い性能を発揮することが確認された。デモでは、プロの声優が漫画の一場面を朗読し、その音声を文字起こしするとともに、感情を自動認識するシステムが展示されていた。この技術は、ロボットや自動音声システムにおいて、人間の感情を認識し、それに応じた応答を生成するといった応用が期待されている。
人とロボットの協働を支えるデジタルツイン
現在のロボティクスでは、ロボットが単独で動作するためのデータセットは存在するが、人とロボットが協働するためのデータは不足している。「デジタルツインを活用した人とロボットの協働支援システム」ブースでは、人とロボットの協働を可能にするデジタルツインシステムの開発が紹介されていた。
![](https://ascii.jp/img/2025/02/05/4159028/x/a8c48c3dd12479a6.jpg)
このシステムを用いることで、デジタルツイン上のバーチャル環境でロボットと共同作業を行って、効率的なデータ収集やコスト削減が期待される。また、得られたデータはロボット側にフィードバックされるだけでなく、従業員のバーチャル研修などにも応用可能だ。デモでは、VRシステムを活用し、地震発生後のコンビニで散乱した商品を片付ける業務トレーニングの様子が展示されていた。現実では再現が難しい環境も、バーチャル空間なら実現可能であることを示す好例といえる。
また、ロボット関連では、「背景知識を活用したもの探しナビゲーション」ブースにおいて、AIによる室内ナビゲーション技術の研究が発表されていた。本研究の特徴は、事前に登録された情報をもとに対象物を探すのではなく、未知の環境や未登録の対象物にも対応できる点にある。
大規模言語モデル(LLM)を活用し、「テーブルはダイニングにある」「トースターは電子レンジの近くにある」といった空間的な関係知識をモデル化。それに基づいてロボットを移動させ、未知の環境でも合理的に対象物を探せるようになった。今後はLLMのファインチューニングなどを通じて、さらなる性能向上が検討されている。
マルチモーダルAIやレースゲームの実況
ブースの中には、すでに実用化が進んでいる技術もあった。「マルチモーダル説明生成:ロボットから宇宙天気予報まで」ブースでは、太陽フレアの予測に関する研究が紹介されていた。深層学習を活用したこのモデルは、3年以上にわたり実運用されており、専門家の予測精度を上回る成果を達成。各国の航空機運用現場などで実際に活用されている。
![](https://ascii.jp/img/2025/02/05/4159030/x/76276df231b4a85b.jpg)
同研究では、AIによる画像説明文生成の評価手法も研究されており、世界最大級のデータセットの約10倍にあたる13万件の人手評価データを学習したモデルを構築。これにより、AIが生成する説明文の人間との相関係数が0.3から0.58まで向上した(人間同士の相関は0.6~0.7)。この相関が人間を超えた場合、それ以降は人間による評価が不要となり、計算資源さえあれば誰でも高精度なAIを開発できるようになると期待されている。
その他、レースゲームの映像を展示していたブースでは、「状況を考慮してデータを解釈し情報伝達する人工知能」に関する研究が紹介されていた。このAIは、レーシングゲームのプレイ内容をリアルタイムで実況する技術を開発している。
本研究では、車の位置やハンドル角度といった時系列データや、サーキット情報などのメタデータを解析し、実況を自動生成する。なお、数値データの処理から音声生成まで約2秒の遅延が発生するため、「車がぶつかった」などの即時性が求められる状況では、ルールベースのAIを併用して、遅延を最小限に抑えている。今後は、レースゲーム以外にも実際のサッカーや自転車レースなどでの応用が検討されている。
データの収集や学習方法の革新、ロボットとの協働、リアルタイム解析技術の向上など、AIの可能性はますます広がっている。本報告会では他にも数多くの研究内容が発表されていた。いずれもAIの社会実装に向けた多様なアプローチが紹介され、研究者たちがそれぞれの視点から課題解決に挑む姿が印象的だった。
この記事に関連するニュース
-
AskDona、数式・化学式の抽出機能を強化
PR TIMES / 2025年2月6日 11時45分
-
AIで障害物も回避…韓国ニューロメカ「人間と協調して動く」ロボットの新機能公開
KOREA WAVE / 2025年2月6日 8時0分
-
音声・音響信号処理分野のトップカンファレンス「ICASSP 2025」にて主著論文採択
PR TIMES / 2025年1月24日 13時15分
-
実世界の困難作業自動化を目指したロボット基盤モデルの研究開発を本格始動
共同通信PRワイヤー / 2025年1月23日 14時0分
-
千葉工業大学、NEDO委託事業「実世界に埋め込まれる人間中心の人工知能技術の 研究開発」プロジェクト最終成果報告会に参加
Digital PR Platform / 2025年1月10日 20時5分
ランキング
-
1マイクロソフト、Windows 10のセキュリティ更新費用は毎年高くなることを説明
ASCII.jp / 2025年2月7日 16時30分
-
2Androidに40件以上の脆弱性 Pixelはアップデート配信を開始
ASCII.jp / 2025年2月6日 13時20分
-
3B賞のアスカは必見!「エヴァンゲリオン」新作一番くじ発売―「エヴァ量産機」も存在感抜群
インサイド / 2025年2月7日 0時10分
-
4楽天モバイルで利用できるスマホを確認する方法
ITmedia Mobile / 2025年2月7日 11時20分
-
5世界に6部だけ!TYPE-MOONファンざわつかせたコピー誌版「空の境界」のヤフオクが終了―驚きの落札額に
インサイド / 2025年2月7日 18時15分
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/mission_close_icon.png)
記事ミッション中・・・
記事にリアクションする
![](/pc/img/mission/point-loading.png)
エラーが発生しました
ページを再読み込みして
ください
![](/pc/img/mission/mission_close_icon.png)