ChatGPTでも、Geminiでもない…ネット情報を学習し尽くした「生成AI」の次にやってくる"進化系AI"の実力
プレジデントオンライン / 2024年12月19日 7時15分
■自分と同じ価値観で判断する「分身AI」の登場
たった2時間のインタビューで、あなたと同じ判断を下す「分身AI」が作れる──。スタンフォード大学とGoogle DeepMindの研究チームが、衝撃的な研究成果を発表した。人間の意思決定を85%の精度で再現できるAIの開発に成功したという。
2022年11月に鮮烈なデビューを飾ったChatGPTの登場以降、生成AIはすっかり一般企業に浸透した。現在では、米トヨタの研究部門が車両デザインに取り入れていると報じられているほか、すでに米企業の7割で導入されているとの調査結果がある。
一方、OpenAIやGoogleなどAI開発各社は、次世代モデル開発における性能の頭打ちに悩む。そこで、次なる一手として期待されているのが、対話形式ではない新たなタイプのAIだ。パソコン操作を完全に自動化するAIエージェントや、人間に代わって判断を下すモデルなどの開発が進行しており、日々の作業を自動化する未来も見えてきた。生成AIの開発路線は今、大きな転換点を迎えている。
■米企業の7割以上が生成AIを導入、トヨタも車両デザインに活用
ChatGPTやGeminiなど、現行型生成AIの導入はすでに幅広い業界で進んでいる。IT市場調査大手の米ガートナーは9月、産業界における生成AI活用の実態調査結果を公開した。
代表的な活用事例として、トヨタの取り組みが注目を集めている。米シリコンバレーに本社を構えるトヨタ・リサーチ・インスティテュート(TRI)はStability AIと提携し、車両デザインプロセスに生成AIを導入。手書きの初期スケッチから様々なバリエーションを生成できるようになり、デザインフェーズの時間短縮や後工程での予期せぬ変更の最小化、さらにはスケッチ作成の高速化を実現したという。
ガートナーが調査対象とした145件の導入事例のうち、業界別では、ライフサイエンス分野が39件と最も多かった。同分野の導入効果としては、業務効率化が23件で突出しており、経済面以外での価値向上が8件、収益増加が5件、リスク管理が3件と続く。
ライフサイエンスに次いで導入事例が多いのは、交通分野で35件だった。内訳は業務効率化と経済面以外での価値向上が共に16件で並び、収益向上とリスク管理はそれぞれ1件と2件で少ない。分野によって効果は異なるものの、業務効率化が最も大きな割合を占めている傾向が強い。
■まったく導入しない企業のほうが少数派に
このほか、銀行、投資サービス、小売、医療サービス、通信サービス、製造など、幅広い産業で生成AIの導入が進んでいる。
生成AIをまったく導入していない企業は、もはや少数派と言えるかもしれない。米ペンシルベニア大学のウォートン・スクール経営大学院はこのほど、マーケティングコンサルティング会社のGBK Collectiveと共同で、企業における生成AIの採用状況に関する調査報告書を発表した。
調査は従業員1000人以上からなる大規模企業を対象に、上級幹部800人以上に対して実施された。その結果、生成AIの週次利用率は2023年の37%から2024年には72%へと、約2倍に増加していることが明らかになった。特に、これまで採用が遅れていたマーケティングや人事部門での利用が顕著に伸びているという。
報告書によると、生成AIに対する経営幹部の受け止め方にも変化が見られた。導入初期には「好奇心」や「驚き」といった反応が主だったが、現在では「満足」や「興奮」といった、より生産的な感情に移行。また、AIに職を奪われるのではないかといった否定的な懸念については、当初と比べて弱まってきているという。
■学習させてももう進歩しない…生成AIに見えてきた限界
課題もある。多様な業界で導入の進む生成AIだが、そのロードマップは順風満帆というわけではない。性能の向上が求められるなか、早くも成長に陰りが見えてきたとの指摘が出始めた。
現状、文章系の生成AIにおいて誤った回答を自信ありげに示す「ハルシネーション(幻覚)」が問題となっているほか、イラスト系AIが人間の指などの入り組んだ物体の描画を苦手とするなど、制限がある。性能向上は急務だ。
米ITメディアの「インフォメーション」は、OpenAIの次期主力モデル「Orion(オリオン)」の開発状況を報じた。OpenAIの従業員による内部テストでは、既存モデルを上回る性能を示したものの、GPT-3からGPT-4への進化ほどの飛躍は見られなかったという。特にコーディング分野では、従来モデルを安定的に上回ることができていないとされる。
この状況を受け、OpenAIは新たに基礎チームを設置。学習データの不足に対処すべく、AIモデルが生成した合成データを再び学習源として活用する次善策や、学習後のモデル改善に注力する方針だ。ただし、AI生成物の再学習によるデータ汚染と、学習品質の低下が懸念されている。同社はOrionのコードネームで知られる次期モデルのリリースを、来年以降に持ち越した。
■まったく新しいAIの姿
米テックメディア大手のヴァージは、「AIは壁にぶつかっているのか? AIの専門家は皆、新しいモデルがスケーリングの壁にぶつかっていることに同意しているようだ」と題する記事を掲載。生成AIの限界を報じている。
AI開発はこれまで、学習するデータ量と計算能力を増やすことで、指数関数的な性能向上が得られるとされてきた。しかし、Googleをはじめとする各社で、次世代AIモデルの開発において収益逓減が見られ始めている、と記事は指摘する。
収益逓減とは、投入するリソースを増やしたにもかかわらず、成果がほぼ頭打ちとなる状態を指す。この「壁」の存在により、次世代の主要AIモデルが現行モデルから飛躍的な進化を遂げるという従来の未来予想図に影が差し始めた。そこで求められているのが、ChatGPTの延長線上にない、まったく新しい生成AIの姿だ。
■グーグル系研究機関が「人格コピーAI」を発表
このように既存の生成AIに限界説が囁かれるなか、注目すべき新たなモデルが発表された。ユーザーの問いに答えるだけのChatGPTとは異なり、本人に代わり、本人の価値観で物事を判断するAIエージェントだ。まだ研究段階だが、査読前の論文として公表されている。本人の思考を85%の精度で真似られるという。
マサチューセッツ工科大学が発行する科学技術メディアのMITテクノロジー・レビューは11月20日、「AIがあなたの性格を再現できるようになった」と報じている。ここで取り上げられているのが、スタンフォード大学と、Google系列のAI研究機関であるGoogle DeepMindによる新しい研究だ。「2時間のインタビュー」を受けるだけで、思考パターンをAIモデルとして構築。「あなたが下すであろう決断を、(AIが)実際に下す」ことが可能になったとされる。
■2時間程度のインタビューで85%の精度で再現
研究チームが発表した論文によると、研究ではアメリカの一般市民1052人を対象に、2時間程度のインタビューを実施した。年齢や性別、人種、地域性などを考慮して対象者を選定し、1人あたり平均6491語に及ぶ詳細な回答データを収集した。これらのデータを大規模言語モデル(LLM)で分析することで、各個人の考え方や行動パターンの再現が可能になったとしている。
システムの精度を検証するため、チームは社会学の標準的な調査手法であるアメリカの「総合的社会調査(General Social Survey)」を用いた実験を行った。その結果、AIは実際の回答者が2週間後に同じ質問に答えた際の一致率と比較して、85%の精度で回答を予測することに成功したという。
また、性格診断として知られるビッグファイブ検査では80%の一致率を示し、経済的な意思決定を分析する実験でも66%の精度を達成。さらに、5つの社会科学実験のうち4つで人間の被験者と同様の結果を再現し、その効果の大きさは実際の人間の結果と98%の相関を示したという。
(補足:総合的社会調査における精度算出の詳細……同じ人間が2週間後に同じ調査に回答した場合でも、機械のように同じ回答をするわけではなく、一致率は平均81.25%となる。そこで、この誤差までであれば本人による回答の範囲内とみなす。生成AIエージェントの予測精度は68.85%であることから、人間の自己一致率81.25%に対して約85%の精度となる。なお、総合的社会調査に完全にランダムに回答した場合、各設問に偶然に一致する確率は平均27.03%に留まる。)
■ちいさな「自分の分身」が、少しのインタビューで手軽にできる
研究に携わったスタンフォード大学コンピューターサイエンス学科の博士課程学生、ジュン・ソン・パーク氏は、MITテクノロジー・レビューの取材に対し、「小さな『あなた』たちが動き回って、あなたが下したであろう決定を実際に下すことができる。究極的な未来がここにあります」と語っている。
研究チームは目下、多数のAIエージェントを用意することで、大人数を対象にした社会調査を再現するなどの用途を想定している。費用や倫理的な制約から、大人数の人間を対象に実施することが難しい研究がある。こうした研究で人間の代わりに、AIエージェントに回答させるよう開発された。
具体的には、ソーシャルメディアにおける誤情報の拡散の仕組みを解明して対策したり、あるいは道路上で渋滞を引き起こす行動などをより容易に検証したりなどに応用できるという。より発展的な利用法として、将来的には各個人の経験と価値観を反映し、業務上の判断を自動化するなどにも応用できるだろう。
学習の手軽さも利点だ。AIを活用したデジタルツイン作成企業タバスのハサーン・ラザ最高経営責任者は、従来の方法では大量のデータが必要だったものの、「今日30分、明日30分などと、AIのインタビュアーと話すだけで、自分のデジタルの分身を作ることができます」と、新手法の効率性を評価している。
■完成度が高まればディープフェイクへの悪用懸念も
英テクノロジーメディアのテック・レーダーは、「人格は数値化できないように思えるが、この研究により、一定の質問への回答から、比較的少ない情報量で個人の価値観を抽出できることが明らかになった」と有用性を評価。「少なくとも管理された実験環境においては、AIは人格を説得力のある形で模倣することが可能だ」と結論付けている。
もっとも、AIで人間の「分身」を作成するこの技術に関しては、倫理上の懸念もある。
MITテクノロジー・レビューは、生成AIによる偽の画像や動画「ディープフェイク」の作成が容易になったのと同様に、この技術により個人の同意を得ることなく、他者をオンライン上で模倣することが可能になる危険性があると述べている。
英テクノロジーメディアのテック・レーダーは、新技術が比較的短時間で個人の性格を模倣できる点に注目し、「オンラインで他人になりすますツールとして、詐欺師たちが活用する恐れもある」と指摘する。
このような懸念はあるものの、新たな生成AIの方向性として、個人の人格を再現するモデルの有用性は高いと言えるだろう。
■意外に手間がかかる現行型AI
現在開発中の技術と組み合わせれば、日々のタスクをほぼ完全に自動化する道も見えてくる。
ChatGPTなど現行の生成AIは、ユーザーからの指示待ちが基本だ。ユーザーが質問を投げかければ答えを返してくれるが、続く作業はユーザー自身が行う。AIを使っているはずが、意外にも手間が多いことに気づく。
例えば、出張のホテルを予約する場面を想定しよう。ChatGPTやGeminiに出張先を教えれば、利便性の高い宿泊エリアの候補を回答してくれるだろう。しかし、その先はユーザーの手作業となる。宿泊予約サイトを複数巡り、希望の条件で予算に収まる施設を比較し、個人情報を手で入力して予約を済ませる。AIが行ってくれた作業は、思いのほか限定的だ。
そこで、いまAI開発各社が完成を急ぐのが、パソコン操作を代行するAIエージェントだ。米テックメディアのヴァージによると、Googleは12月にも独自のAIエージェント「Gemini」の次世代版を公開する見込みだという。ChatGPTのOpenAIも、2024年1月に新製品の発表を予定している。
さらに、MetaもAIエージェントの開発を進めており、ChatGPTの対抗馬「Claude」を開発するAnthropicはすでにAPI(プログラムからAIを呼び出す仕組み)を通じて基本的なエージェント機能の提供を始めている。
米AI開発支援企業「スケールAI」のアレクサンドル・ワン最高経営責任者(CEO)は、「AIエージェントにも、対話型AI『ChatGPT』が実現したような画期的な瞬間が訪れるでしょう」と述べ、「汎用的なエージェントが相当な人気を集めるはずです」との見通しを示している。
■勝手に「息抜き」も…未完成のAIエージェント
ただし、現状のAIエージェントは完成にはほど遠い。Anthropic社は、Claudeによるコンピューター操作機能のデモンストレーション中、予期せぬトラブルに見舞われた。
ヴァージによると、長時間の画面録画中、Claudeは誤って録画停止ボタンを押してしまい、それまでの映像データが全て消失したという。さらに別のデモでは、プログラミングのデモンストレーション中に、Claudeが突如として作業を中断。イエローストーン国立公園の写真を閲覧し始める始末だった。ある意味で人間らしいと言えるだろうか。
こうした予期せぬ動作は、Anthropic社の研究者たちにとっても想定外だったという。ヴァージによると、同社は現在のClaudeについて、画面のスクロールやドラッグ、ズームといった基本的な操作でも困難を抱えていることを認めている。
■旅行予約サービスでは、すでにアルファ版が提供中
とはいえ、紆余曲折がありつつも、自動化の流れが止まることはなさそうだ。米テックメディアのテック・クランチは、世界最大級の旅行予約サイト「エクスペディア」の元上級副社長であるマイケル・グルマン氏が、AIを活用した出張予約サービス「Otto」を立ち上げたと報じている。
グルマン氏は同サイトの消費者向け製品部門のトップを務めた経験を活かし、自然言語による航空券やホテルの予約処理システムを開発。たとえばルーフトップバーのあるホテルを探すなど、エクスペディアならば検索条件も存在せず、検索に苦労するようなホテルも容易に見つけるという。
システムは予約状況や日程の変更を常時把握し、第一希望のホテルが満室の場合は近隣の代替施設を提案するなど、柔軟な対応を行う。希望の条件に合う施設がなく人間の判断が必要な場面では、処理を中断して人間の判断を仰ぐ。すでに今年9月にアメリカで限定アルファ版をリリースしており、2025年初頭の一般提供開始を目指している。
このサービス単体では、条件に合致するホテルがない場合、人間の判断が必要となる。だが、将来的に先の人格コピーAIのようなエージェントとの組み合わせが実現すればどうだろうか。本人ならば好むであろう次善の条件で自動的に再検索を行い、ユーザーは最終確認に同意するだけで出張の手配が完了するかもしれない。
このようなほぼ完全な自動化は、この先AIが発展するにつれ、ホテル予約に限らず日常の業務の広い範囲をカバーするようになることも考えられる。
■進化をつづける生成AIに、活用のアイデアが求められている
生成AIは、私たちの働き方や生活を大きく変えようとしている。その変化の方向性は、大きく2つに分かれるだろう。
一方は、ChatGPTに代表される「アシスタント型AI」の進化だ。しかし、その発展には早くも限界が見え始めている。データ量と計算能力を増やすだけでは、もはや劇的な性能向上は望めない。
他方は、急速に注目されるようになった「エージェント型AI」だ。人格を再現するAIや、パソコン操作を代行するAIなど、エージェント(人間の代行者)として、自律的に行動するモデルの開発が加速している。
まだ発展途上だが、その可能性は計り知れない。出張の手配など本業務以外のタスクを代行させれば、よりゆとりを持って本来のタスクに当たることができるようになるだろう。
また、中核業務についても、自身の知識とバックグラウンドに基づいた業務計画の候補を挙げさせるなど、人間のタスクを部分的に担わせることができるかもしれない。その上で人間が最終判断とブラッシュアップを施せば、これまでよりも質の高い成果物を短時間で出せることだろう。
エージェント型AIはまだ開発のごく初期段階にあるが、常に進化している。最新のトレンドを把握し、いかに生活に取り入れるか、ユーザーとしても使い方にアイデアが求められそうだ。
----------
フリーライター・翻訳者
1982年生まれ。関西学院大学を卒業後、都内IT企業でエンジニアとして活動。6年間の業界経験ののち、2010年から文筆業に転身。技術知識を生かした技術翻訳ほか、IT・国際情勢などニュース記事の執筆を手がける。ウェブサイト『ニューズウィーク日本版』などで執筆中。
----------
(フリーライター・翻訳者 青葉 やまと)
外部リンク
この記事に関連するニュース
-
AskDona GPT、OpenAIの最新モデル「o1」に対応!
PR TIMES / 2024年12月18日 11時45分
-
奈良先端科学技術大学院大学(NAIST)、ChatSenseを導入
PR TIMES / 2024年12月13日 14時45分
-
OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告
ITmedia NEWS / 2024年12月6日 15時5分
-
LLMとは? 生成AIとの違いや企業の活用事例を解説
マイナビニュース / 2024年12月4日 9時0分
-
企業向けRAGサービス「ChatSense」、最新の「GPT-4o」(11月アップデート版)に対応予定
PR TIMES / 2024年11月21日 14時45分
ランキング
-
1トランプ「会ってもいい」に潜む罠…大統領就任式前の日米会談、石破首相にこれだけのリスク
日刊ゲンダイDIGITAL / 2024年12月18日 16時3分
-
2【12月20日限定】ステーキガストが年内最後の「ステーキ食べ放題」を開催!
東京バーゲンマニア / 2024年12月18日 19時58分
-
3大阪の天神橋筋商店街「長さ日本一」から陥落? 東京側の首位宣言に「インチキ」の声も
産経ニュース / 2024年12月18日 16時30分
-
4車の「フロントガラス交換」近年なぜ高額に? 「数十万円超え」の請求例も! “そのまま放置”は「絶対NG!」 走行中「突然の悲劇」 どう対処すべき?
くるまのニュース / 2024年12月18日 18時40分
-
5「芝居も文章も、うまさの先にはあまり広い世界はありません」…小泉今日子さんが大事にしている「恩師」の言葉
読売新聞 / 2024年12月18日 15時32分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください