Infoseek 楽天

Google、「Gemini 2.0 Flash Thinking」公開 「o1」競合の“思考過程を示す”推論AIモデル

ITmedia NEWS 2024年12月20日 7時41分

 米Googleは12月19日(現地時間)、新たな推論AIモデル「Gemini 2.0 Flash Thinking」を発表し、Experimental(実験)モデルをGoogle AI Studioで公開した。

 Gemini 2.0 Flash Thinkingは、回答の一部としてモデルが行う「思考プロセス」、つまり、問題を解決するためにどのような手順で考え、どのような情報を参照したのかを、人間が理解できる形で示すようにトレーニングされた推論モデル。ベースとした「Gemini 2.0 Flash」よりも、より強力な推論機能を備えており、マルチモーダル理解、推論、コーディングに最適という。

 Google DeepMindとGoogle Researchのチーフサイエンティスト、ジェフ・ディーン氏はXのポストで、「思考を明示的に示すモデル」と説明した。同氏がシェアしたデモでは、「電子は、x=-0.15nmとx=+0.15nm の壁を持つ1次元の無限ポテンシャル井戸に閉じ込められている。電子が井戸内のエネルギーレベルを変えるときに放出される最も波長の長い4つの光子を見つけよ」という課題に対し、AIが考える過程を示しながら解に到達する様子が示されている。

 AI Studioのリードプロダクト、ローガン・キルパトリック氏は、画像を使ったプロンプトの例として、4つのビリヤードの玉の画像に「この中の3つの玉を使って30にするには?」というデモを紹介した。

 米OpenAIの推論モデル「o1」と同様に、複雑な課題を与えると数秒間「Thinking」する。

 Google AI Studioでの利用には、以下の制限がある。

・入力トークンの上限は3万2000個

・テキストと画像の入力のみ

・出力トークの上限は8000個

・テキストのみの出力

・検索やコード実行などの組み込みツールの使用なし

 キルパトリック氏は、「これは、推論の旅の小さな第一歩にすぎない」と語った。

この記事の関連ニュース