1. トップ
  2. 新着ニュース
  3. 経済
  4. ビジネス

急速に進む「ヒューマノイドロボット」導入の動き テック企業が今、「人型」にこだわる本当の理由

ITmedia ビジネスオンライン / 2024年7月26日 8時10分

 深層強化学習は、AIが試行錯誤によって目的とするルールを獲得する技術といえる。2016年に当時の囲碁の世界チャンピオンであるイ・セドル氏を破ったAI「AlphaGo」に用いられた技術としても有名である。

 囲碁のようなゲームは「相手に勝つこと」、二足歩行は「倒れないこと」というように、深層強化学習では何が成功で何が失敗かのルールを設定する。その上でAIは無数の選択肢から、できるだけ良いとされるものを選ぶように学習する。

 サービスロボットが人に衝突せず、安全に目的地まで移動できるようになったならば、次の課題は行動計画、つまりは考えることである。配膳ロボットも人が指定された場所まで移動しているにすぎず、目的に応じて自ら“考えて”いるわけではない。この行動計画に有効なものが、生成AIである。以下の図は、サービスロボットが取るべき行動計画について、実際にGPT4-oに尋ねた結果である。

 「のどが渇いた、何かない?」に応じる形で、「1.確認と応答」に始まる5つの行動を生成している。実際の制御には、何段もの技術的な壁があるが、もしこの通り行動できたらと考えてみてほしい。人が一つ一つ指示しないと何もできなかった赤子のようなロボットが、一気に自律的で知的なロボットへ進化したように感じるであろう。

 ロボットの行動生成には、「世界モデル」と呼ばれる周辺環境を理解し、予測するための大量の知識が必要である。一般常識ともいえるこの知識は、人間社会で暮らすために必須の情報であり、人は成長の過程で獲得するものだ。GPT-4のような大規模言語モデルは、大量の文章や画像などから、私たちの人間社会に関する断片的な情報をつなぎ合わせ、おぼろげながら「原始的な世界モデル」を作り出している可能性が高い。

 世界モデルは長年研究されてきたが、大量の常識をいくらデータ化したとしても、無限ともいえる情報を作り続けるのは難しく、解決にはまだ相当な時間がかかると思われていた。

 このため、文章や画像などインターネットにある大量の情報から、無作為に学習したにすぎない大規模言語モデル(LLM)が、不完全ながらもロボットに有効な行動を生成できた点は画期的だったといえる。

●ヒューマノイドロボットによる“身体的体験”データの価値

 ヒューマノイドロボットを開発する企業の動きも速かった。BMWと契約したFigureは、すでに生成AIによる行動生成を試し始めている。2024年2月には、生成AIのキープレイヤーであるOpenAI、マイクロソフト、NVIDIAなどから、総額6億7500万ドルの資金を調達した。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください