OpenAI、次世代AIモデル「o3」を発表、ARC-AGIテストで”85%超え”の快挙達成
マイナビニュース / 2024年12月21日 17時21分
O3は「ARC-AGI-1」で87.5%を記録した。ARC-AGIは、AI研究者のフランソワ・ショレ氏が2019年に考案したもので、AIが単なるデータの相関関係の学習ではなく、抽象的な概念を理解し、新しい状況に適用できる能力を評価する。
例えば、上の図の入力と出力の違いを問われた場合、四角の空白スペースを濃い青で埋めているだけであるとすぐに分かる。人間にとっては容易に理解できる規則性だが、「抽象化」と「推論」を苦手とするこれまでのAIにとってこうした問題は難問なのだ。
ARC-AGIにおける人間の平均達成率は84%であり、そのため85%をクリアすることがAIの大きなマイルストーンと見なされていた。しかし、OpenAIのモデルでも2020年のGPT-3の0%から2024年のGPT-4の5%まで、わずか5%に4年を要するなど、スコアが全く伸びない状態が長く続いていた。
o3の登場により、AI開発の競争は「推論能力の差異」が問われる新たなステージに突入したといえる。ARC Prize財団は、評価基準を引き上げた「ARC-AGI-2」を2025年第1四半期にローンチする予定であり、さらに2019年のARC-AGIフォーマットから完全に脱却して新たなニーズに対応した第3世代ベンチマークの開発にも着手している。
o1が主に訓練段階での精度向上に焦点を当てていたのに対し、o3では推論時の柔軟性と効率性を重視した設計が採用されている。o3-miniにより、リソース制約がある環境や特定タスク向けの応用範囲が大幅に広がる。o3-miniは低・中・高の3段階で推論時間を設定でき、タスクの性質や使用環境に応じて処理速度と精度を調整することが可能である。以下は、o1、o1-mini、o3-mini、o3のCodeforces Eloスコアと計算コストの比較である。
o1は回答時間と高いコストという課題を抱えていたが、o3-miniは性能とコストのバランスを取りながら、多様なユースケースに対応できる柔軟なモデルとなっている。「低」設定では低コストで実用的な性能を提供し、「高」設定ではo1を上回る性能を発揮しながら、フルモデルのo3よりコストを大幅に抑えられる。
o3とo3-miniは、安全性とセキュリティを検証するプログラムを通じて、まずは研究者向けに早期アクセスが提供される予定である。順調に進めば、2025年1月末にo3-miniの提供を開始し、その後フルモデルのリリースに至る見込みである。
(Yoichi Yamashita)
-
- 1
- 2
外部リンク
この記事に関連するニュース
-
OpenAIの「12 Days」まとめ
ITmedia NEWS / 2024年12月21日 8時8分
-
米OpenAI、新たなAIモデル「o3」発表 「AGI」に最も近い性能に
ITmedia NEWS / 2024年12月21日 3時8分
-
「GPT-4o mini」と「GPT-4o」のどちらを選ぶ?
ITmedia Mobile / 2024年12月16日 19時40分
-
OpenAI「ChatGPT Pro」プラン発表、深い推論で信頼性の高い応答を提供、月額200ドル
マイナビニュース / 2024年12月6日 7時6分
-
中国Alibaba、論理的推論重視のAIモデル「QwQ-32B-Preview」リリース
ITmedia NEWS / 2024年11月29日 9時41分
ランキング
-
1『星のカービィ』レコード風スピーカーがプライズ展開!くるくる走りまわるカービィと、見守るワドルディが可愛い
インサイド / 2024年12月22日 0時30分
-
2iPhoneのバッテリーを長持ちさせる機能、実はiPhone 15以降だと少しカスタマイズできる
ITmedia Mobile / 2024年12月22日 10時5分
-
3「理解できない」 大谷翔平と真美子さんの“スキンシップ”に海外驚き 「文化は100%違う」「伝説だわ」【大谷翔平激動の2024年 現地では「プレー以外のふるまい」も話題に】
ねとらぼ / 2024年12月22日 7時5分
-
4後輩が入手した50円玉→よく見ると…… “衝撃価値”の不良品硬貨が1000万表示 「コインショップへ持っていけ!」
ねとらぼ / 2024年12月22日 8時10分
-
5アップル「iPhone SE(第4世代)」カメラはiPhone 16同等か
ASCII.jp / 2024年12月21日 20時0分
記事ミッション中・・・
記事にリアクションする
記事ミッション中・・・
記事にリアクションする
エラーが発生しました
ページを再読み込みして
ください