Infoseek 楽天

「ChatGPTの瞬間」をロボティクスに...NVIDIAの新AIプラットフォーム「Cosmos」とは?

ニューズウィーク日本版 2025年1月8日 12時20分

トム・ハワース
<人工知能とロボティクスの未来を切り拓く新たなプラットフォームが登場した。NVIDIAが発表した「Cosmos」は、生成AIを活用し、ロボットや自動運転車のトレーニングと開発に革新をもたらす>

人工知能(AI)と高速計算技術のグローバルリーダーであるNVIDIAは、新しいAIプラットフォーム「Cosmos」を発表した。

ラスベガスで開催されたコンシューマー・エレクトロニクス・ショー(CES)で発表されたこのプラットフォームは、生成AIを活用することで、ロボティクスや自動運転車(AV)の開発を革新することを目的としている。

Cosmosは、複雑な現実世界のシナリオでロボットやAVをトレーニングする際の課題に対処するために設計されている。このプラットフォームの中心となるのは「World Foundation Models(WFMs)」と呼ばれる先進的なニューラルネットワークで、精密な動画シミュレーションを生成できる能力を持つ。

これらのモデルは、2000万時間分の実世界のロボティクスや運転映像からなる前例のないデータセットでトレーニングされており、物理的に正確でリアルな仮想環境を開発者が作成できるようになっている。

NVIDIA Cosmosとは?

Cosmosは、合成データ生成をサポートしており、大規模な実世界のデータセットに依存せず、仮想空間でシステムをシミュレートおよびテストできる。

これは、ロボティクスやAVのような業界にとって画期的な変化をもたらす可能性がある。これらの分野では、例えば雪道のような条件や珍しい人型の動きなど、多様で高品質なデータを収集することがこれまで非常にコストと時間を要する課題だった。

「物理AIはビッグデータの問題を抱えている」と、NVIDIAのシニアリサーチマネージャーであるジム・ファン氏はX(旧Twitter)の投稿で述べている。「合成データがこの問題を解決します!私たちはCosmosをロボティクスや自動運転向けの大規模な合成データ生成に適用しており、今やあなたもこれを自由に活用して微調整できます。」

NVIDIAはCosmosをオープンソースソフトウェアとしてHugging Faceプラットフォームを通じて公開している。初期の採用者にはUber、Agility Robotics、Waabi、Wayveといった業界リーダーが名を連ねている。

NVIDIA Cosmosはどのように機能するのか

Cosmosは生成AIとNVIDIAの強力なシミュレーション技術を組み合わせ、開発者がロボットやAVを構築するのを支援する。プラットフォームは、Nano、Super、Ultraという3つのパフォーマンスレベルに応じたモデルを備えている。

このプラットフォームでは、現実の物理現象を再現する仮想環境を作成できる。例えば、倉庫内で落下物を検知するロボットや予測不能な道路状況をナビゲートするAVをトレーニングすることが可能だ。

これらのシミュレーションは「次のトークン」の予測を提供し、ロボットやAVが最適な行動を予測して選択するのに役立つ。

「重要な革新の一つはWFMsへの依存であり、これは物理的なインタラクションにAIを近づける大きな進歩を示している」と、英国ハートフォードシャー大学の人間-ロボット相互作用教授であるファーシド・アミラブドラヒアン氏はニュースウィークに語った。「これらのモデルは非常にリアルなシミュレーションを可能にし、現実世界に近いトレーニングデータを提供する。」

Cosmosにはデータ処理やモデルの微調整を行うためのツールも搭載されている。NVIDIAのGPUを使用することで、従来では数年かかっていた2000万時間分のデータ処理をわずか14日で完了できる。

AIとロボティクスにおけるゲームチェンジングな瞬間か?

NVIDIAのシミュレーション技術担当副社長であるレヴ・レバレディアン氏は、Cosmosについて「AVやロボティクス業界にとって完全にゲームチェンジングだ」とフォーチュン誌に語った。

一方、CEOのジェンセン・フアン氏は、月曜日の発表の中で「ロボティクスにおけるChatGPTの瞬間はもうすぐ訪れる」と述べ、数年前にOpenAIのテキスト生成モデルが巻き起こした熱狂を彷彿とさせた。

他の専門家も同様にこのニュースに興奮を示している。「Cosmosは変革的な可能性を秘めている」とアミラブドラヒアン氏は語った。「ロボティクスにおける最大の課題の一つは、AIシステムを現実世界の応用に一般化することだが、Cosmosはこれに直接対処している。リアルタイムの適応力を向上させ、開発を合理化することで、医療、製造、物流といった業界全体の進歩を加速させる可能性がある。」

それでも課題は残っている。ロボットが現実世界を完全に「理解」するためには、モデルにさらに強力かつ洗練された能力が求められる。

Cosmosは現実世界のリアルなモデルを作成するのに役立つが、ChatGPTが自身が書いている理由を理解していないのと同じように、Cosmosも再現する物理法則を理解しているわけではない。

また、コスト、安全性、規制、そして公共の認識といった障壁も残されているとアミラブドラヒアン氏は述べている。

この記事の関連ニュース