Anthropic、コーディングと推論能力を大幅に強化した「Claude Sonnet 4.5」を発表

編集者: Veronika Radoslavskaya

Anthropicは、AIモデル「Claude Sonnet 4.5」のリリースを発表しました。この最新モデルは、特にコーディングと推論の分野で顕著な進歩を遂げており、SWE-bench評価で77.2%という業界最高水準のパフォーマンスを達成しています。Claude Sonnet 4.5は、複雑で多段階にわたるタスクにおいても30時間以上にわたって集中力を維持できる能力を持ち、開発者の生産性を飛躍的に向上させる可能性を秘めています。

今回の発表には、Claude Sonnet 4.5のリリースに加え、AIツールの機能強化も含まれています。新たに導入された「Claude Code Checkpoints」は、作業の進捗状況を保存し、以前の状態に簡単に戻すことができる機能です。これにより、開発者は安心して実験的な作業を進めることができます。また、Claude APIには、より長時間のタスクに対応するためのコンテキスト編集やメモリツールが追加され、APIの機能が拡張されています。さらに、Claudeアプリケーション内でのコード実行とファイル作成が統合され、直接コードを実行し、ファイルを生成することが可能になりました。

開発者向けには、「Claude Agent SDK」が提供され、Anthropic自身が使用しているツールと同じ基盤を用いてAIエージェントを構築できるようになります。これにより、開発者はより高度なAIアプリケーションを容易に開発できるようになります。Claude for Chrome拡張機能も、待機リストに登録したMaxユーザー向けに提供が開始されました。

Anthropicは、Claude Sonnet 4.5を既存のすべてのアプリケーションに対して、同価格帯で性能が大幅に向上したドロップインリプレイスメントとして推奨しています。この新しいモデルは、OpenAIのChatGPT Enterprise、MicrosoftのCopilot、GoogleのGeminiといった主要な競合製品に対抗する強力な選択肢として位置づけられています。Claude Sonnet 4.5は、その高度なコーディング能力と推論能力により、ソフトウェア開発の現場に新たな標準をもたらすことが期待されています。この進化は、AI技術が私たちの働き方や創造性をどのように変革していくかを示す、重要な一歩と言えるでしょう。このモデルは、金融、法律、医療などの専門分野においても、従来のモデルを凌駕するドメイン固有の知識と推論能力を示すとされています。さらに、安全性とアライメントの評価においても大幅な改善が見られ、不正行為や誤解を招くような挙動が減少しています。

ソース元

  • PYMNTS.com

  • Anthropic: Claude Sonnet 4 - AI Model Details & Benchmarks

  • Release Notes | Anthropic Help Center

  • Anthropic releases Claude Sonnet 4 and Claude Opus 4 | InfoWorld

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。