Anthropic「Claude 3.5 Sonnet」を強化、AIでPC作業を自動化する新APIが話題に

マイナビニュース / 2024年10月23日 7時48分

画像提供：マイナビニュース

米Anthropicは10月22日（現地時間）、大規模言語モデル「Claude 3.5 Sonnet」のアップグレードと、新モデル「Claude 3.5 Haiku」を発表した。Claude 3.5 Sonnetは全面的に改良され、特にコーディング分野で大きな進歩を遂げている。Claude 3.5 Haikuは、前世代のHaikuと同じコストと同程度のスピードで、いくつかのベンチマークでClaude 3 Opusに匹敵する性能を示している。また、「Computer use」というAPIのベータ提供を開始した。これはClaude 3.5 SonnetをAIエージェントにしてコンピュータでの作業を自動化するもので、大規模言語モデルの可能性を広げるものとして注目を集めている。

Claudeシリーズには、高性能モデル「Opus」、インテリジェンスとスピードのバランスがとれた「Sonnet」、コンパクトで高速な「Haiku」の3つのバリエーションがある。今年6月、Anthropicは"3.5"ファミリーの最初のリリースとして、Claude 3.5 Sonnetの提供を開始した。

Claude 3.5 Sonnetのアップグレードでは、GPQA（大学院レベルの専門知識を問うデータセット）のスコアが59.4%から65.0％に向上し、SWE-bench（実世界のソフトウェア課題を解決する能力を測るベンチマーク）のスコアも33.4%から49.0％に大幅に改善された。これらの性能向上は、従来のコストやスピードを維持したままで提供される。

Claude 3.5 Haikuは、コーディングタスクに強いという"3.5"ファミリーの特徴を持ち、全てのスキルセットで Claude 3 Haikuを上回る。HumanEval（プログラミングタスクの正確性からコード生成能力を評価）は88.1％、MATH（数学的な推論能力を評価）は69.2％を記録し、これらはそれぞれClaude 3 Opus（HumanEval：84.9%、MATH：60.1％）を上回る。低レイテンシ、命令追従の改善、正確なツールの使用により、専門的なサブエージェントタスクや、大規模データからの個別体験の生成（在庫記録や購買履歴など）に強みを発揮する。

「Computer use」を通じて、開発者はClaude 3.5 Sonnetモデルを使用してコンピュータのデスクトップ環境を操作（コンピュータ画面の解析、カーソルの操作、ボタンのクリック、テキスト入力など）できるツールとの相互作用が可能となる。コンピュータのタスクを自動するツールは、RPAツールのベンダーから新興企業まで数多くの企業が手掛けており、さらに近年AIエージェント開発で競争が激化している。 AIが人と同じようにコンピュータ・ソフトウェアと直接対話できるようになれば、従来のAIアシスタントには不可能だった膨大なアプリケーションの可能性が広がる。

津波情報気象庁発表

地震情報

Anthropic「Claude 3.5 Sonnet」を強化、AIでPC作業を自動化する新APIが話題に

この記事に関連するニュース

トピックスRSS

ランキング

★ 注目の特集

ITトピックス ITトピックスFeed