米Googleは12月11日(現地時間)、次世代AIモデル「Gemini 2.0」を発表した。画像や音声の出力、ツールのネイティブ使用などが可能だ。
まずは、開発者や試験的に使う人に向け、「Gemini 2.0 Flash」として提供する。ベンチマークでは、応答速度は「Gemini 1.5 Flash」と同等でありながら、「Gemini 1.5 Pro」を超えるパフォーマンスを記録した。
テキストを含む生成画像や、操作可能なテキスト読み上げ(TTS)による多言語音声などをサポートし、Google 検索、コード実行、サードパーティのユーザー定義関数などをネイティブに呼び出せる。
Geminiユーザーはこれらが可能になったGemini 2.0 Flashを利用できる。
加えて、高度な推論と長文脈や前後関係を理解する能力を持ち、複雑なトピックを探索してユーザーの代わりにレポートを作成する「Deep Research」という新機能も提供する。対象はサブスクプランサービス「Gemini Advanced」ユーザーだ。