【シリコンバレー時事】米グーグルは11日、生成AI(人工知能)の次世代基盤モデル「ジェミニ2.0」を開発したと発表した。「ジェミニ」の特徴である、文章や画像、音声を一元的に扱える「マルチモーダル」な性能を強化。新機能を活用したウェブ検索結果の要約サービスは、今週から対象を限定し試験提供する。
応答が速い軽量版「ジェミニ2.0フラッシュ」も登場。同日から開発者向けに試験サービスを始めた。一般利用者もウェブサイト版の生成AIサービス「ジェミニ」で、限定的だが機能を試せる。今後はスマートフォンアプリでも体験できるようにするという。
ピチャイ最高経営責任者(CEO)は声明で、「エージェント時代のための次世代モデル」と位置付けた。マルチモーダルで人間のさまざまな仕事を代行するエージェント製品の開発にはマイクロソフトなども参入。競争が激しくなっている。
ウェブブラウザー(閲覧ソフト)「クローム」の操作を代行するエージェントの開発計画「マリナー」も明らかになった。「ジェミニ2.0」を活用。一部への試験提供を通じて性能改善を図っていくという。
デモ動画では「企業リストを記憶し、ウェブサイトと連絡先を見つけろ」との指示を受け、AIが画面を操作していく様子が映し出された。
[時事通信社]