Anthropic「Claude 3.5 Sonnet」を強化、AIでPC作業を自動化する新APIが話題に
マイナビニュース / 2024年10月23日 7時48分
米Anthropicは10月22日(現地時間)、大規模言語モデル「Claude 3.5 Sonnet」のアップグレードと、新モデル「Claude 3.5 Haiku」を発表した。Claude 3.5 Sonnetは全面的に改良され、特にコーディング分野で大きな進歩を遂げている。Claude 3.5 Haikuは、前世代のHaikuと同じコストと同程度のスピードで、いくつかのベンチマークでClaude 3 Opusに匹敵する性能を示している。また、「Computer use」というAPIのベータ提供を開始した。これはClaude 3.5 SonnetをAIエージェントにしてコンピュータでの作業を自動化するもので、大規模言語モデルの可能性を広げるものとして注目を集めている。
Claudeシリーズには、高性能モデル「Opus」、インテリジェンスとスピードのバランスがとれた「Sonnet」、コンパクトで高速な「Haiku」の3つのバリエーションがある。今年6月、Anthropicは"3.5"ファミリーの最初のリリースとして、Claude 3.5 Sonnetの提供を開始した。
Claude 3.5 Sonnetのアップグレードでは、GPQA(大学院レベルの専門知識を問うデータセット)のスコアが59.4%から65.0%に向上し、SWE-bench(実世界のソフトウェア課題を解決する能力を測るベンチマーク)のスコアも33.4%から49.0%に大幅に改善された。これらの性能向上は、従来のコストやスピードを維持したままで提供される。
Claude 3.5 Haikuは、コーディングタスクに強いという"3.5"ファミリーの特徴を持ち、全てのスキルセットで Claude 3 Haikuを上回る。HumanEval(プログラミングタスクの正確性からコード生成能力を評価)は88.1%、MATH(数学的な推論能力を評価)は69.2%を記録し、これらはそれぞれClaude 3 Opus(HumanEval:84.9%、MATH:60.1%)を上回る。低レイテンシ、命令追従の改善、正確なツールの使用により、専門的なサブエージェントタスクや、大規模データからの個別体験の生成(在庫記録や購買履歴など)に強みを発揮する。
「Computer use」を通じて、開発者はClaude 3.5 Sonnetモデルを使用してコンピュータのデスクトップ環境を操作(コンピュータ画面の解析、カーソルの操作、ボタンのクリック、テキスト入力など)できるツールとの相互作用が可能となる。コンピュータのタスクを自動するツールは、RPAツールのベンダーから新興企業まで数多くの企業が手掛けており、さらに近年AIエージェント開発で競争が激化している。 AIが人と同じようにコンピュータ・ソフトウェアと直接対話できるようになれば、従来のAIアシスタントには不可能だった膨大なアプリケーションの可能性が広がる。
-
- 1
- 2
この記事に関連するニュース
-
法人向け生成AIプラットフォームAskDona、Claude 3.5 Haikuに対応!
PR TIMES / 2024年11月13日 12時40分
-
Raspberry PiブランドのM.2 SSDが登場/ASUSとGIGABYTEがThunderbolt 5対応拡張カードを発表
ITmedia PC USER / 2024年10月27日 6時5分
-
AI議事録サービス「Rimo Voice」、本日リリースの最新モデル「Claude 3.5 Sonnet (new)」に対応開始
PR TIMES / 2024年10月24日 10時15分
-
Anthropic、「Claude 3.5 Sonnet」更新と「Claude Haiku 3.5」リリースを発表
ITmedia NEWS / 2024年10月23日 9時24分
-
Anthropic、「Claude 3.5 Sonnet」にPCを操作する「Computer Use」(β)追加
ITmedia NEWS / 2024年10月23日 7時39分
ランキング
-
1「スンスンが餌食に」 販売から“全店舗3分で完売”→高額転売で「怒りが込み上げる」 スシロー×人気キャラコラボが物議
ねとらぼ / 2024年11月21日 19時2分
-
2ダイソーの“フィギュアに最適”なアイテムが330万表示 驚きの高品質に「めっちゃいいやん……!」「価格バグってるw」
ねとらぼ / 2024年11月21日 20時0分
-
3イオンカード、不正利用に関するテレビ報道受け声明 「一日も早く安心してもらえる環境整備に努める」
ITmedia NEWS / 2024年11月21日 15時27分
-
4“主人公キャラのいない”ローグライクシューターが早期アクセス開始!AIとなって敵同士を戦わせ道を拓く―採れたて!本日のSteam注目ゲーム11選【2024年11月21日】
Game*Spark / 2024年11月21日 22時30分
-
5原作再現度がハンパない『FF14モバイル』が正式発表! まずは中国からサービス開始へ
ガジェット通信 / 2024年11月21日 22時0分
複数ページをまたぐ記事です
記事の最終ページでミッション達成してください