1. トップ
  2. 新着ニュース
  3. IT
  4. IT総合

Anthropic「Claude 3.5 Sonnet」を強化、AIでPC作業を自動化する新APIが話題に

マイナビニュース / 2024年10月23日 7時48分

画像提供:マイナビニュース

米Anthropicは10月22日(現地時間)、大規模言語モデル「Claude 3.5 Sonnet」のアップグレードと、新モデル「Claude 3.5 Haiku」を発表した。Claude 3.5 Sonnetは全面的に改良され、特にコーディング分野で大きな進歩を遂げている。Claude 3.5 Haikuは、前世代のHaikuと同じコストと同程度のスピードで、いくつかのベンチマークでClaude 3 Opusに匹敵する性能を示している。また、「Computer use」というAPIのベータ提供を開始した。これはClaude 3.5 SonnetをAIエージェントにしてコンピュータでの作業を自動化するもので、大規模言語モデルの可能性を広げるものとして注目を集めている。

Claudeシリーズには、高性能モデル「Opus」、インテリジェンスとスピードのバランスがとれた「Sonnet」、コンパクトで高速な「Haiku」の3つのバリエーションがある。今年6月、Anthropicは"3.5"ファミリーの最初のリリースとして、Claude 3.5 Sonnetの提供を開始した。

Claude 3.5 Sonnetのアップグレードでは、GPQA(大学院レベルの専門知識を問うデータセット)のスコアが59.4%から65.0%に向上し、SWE-bench(実世界のソフトウェア課題を解決する能力を測るベンチマーク)のスコアも33.4%から49.0%に大幅に改善された。これらの性能向上は、従来のコストやスピードを維持したままで提供される。

Claude 3.5 Haikuは、コーディングタスクに強いという"3.5"ファミリーの特徴を持ち、全てのスキルセットで Claude 3 Haikuを上回る。HumanEval(プログラミングタスクの正確性からコード生成能力を評価)は88.1%、MATH(数学的な推論能力を評価)は69.2%を記録し、これらはそれぞれClaude 3 Opus(HumanEval:84.9%、MATH:60.1%)を上回る。低レイテンシ、命令追従の改善、正確なツールの使用により、専門的なサブエージェントタスクや、大規模データからの個別体験の生成(在庫記録や購買履歴など)に強みを発揮する。

「Computer use」を通じて、開発者はClaude 3.5 Sonnetモデルを使用してコンピュータのデスクトップ環境を操作(コンピュータ画面の解析、カーソルの操作、ボタンのクリック、テキスト入力など)できるツールとの相互作用が可能となる。コンピュータのタスクを自動するツールは、RPAツールのベンダーから新興企業まで数多くの企業が手掛けており、さらに近年AIエージェント開発で競争が激化している。 AIが人と同じようにコンピュータ・ソフトウェアと直接対話できるようになれば、従来のAIアシスタントには不可能だった膨大なアプリケーションの可能性が広がる。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください