はじめに – フラッグシップモデル「Opus 4.5」の登場
Anthropicは、同社のフラッグシップモデルの最新版となる「Opus 4.5」を正式に発表しました。これは、9月にリリースされたSonnet 4.5、10月のHaiku 4.5に続く、4.5シリーズの最終モデルとなります。
革新的な性能と新たな機能
Opus 4.5は、その優れた性能で注目を集めています。特に、respectedなコーディングベンチマークであるSWE-Bench Verifiedにおいて、初の80%超えを達成したモデルとなりました。さらに、ツール使用能力(tau2-benchおよびMCP Atlas)や汎用問題解決能力(ARC-AGI 2、GPQA Diamond)など、多岐にわたるベンチマークで最先端のパフォーマンスを示しています。
Anthropicは、Opus 4.5のコンピューター使用およびスプレッドシート機能も強調しており、それらを実証するための関連製品もリリースしました。これにより、これまでパイロット版だった「Claude for Chrome」および「Claude for Excel」がより広く利用可能になります。Chrome拡張機能はすべてのMaxユーザーに提供され、Excelに特化したモデルはMax、Team、Enterpriseの各ユーザーが利用できます。
メモリ管理の進化と「Endless Chat」
Opus 4.5には、長文コンテキスト操作のためのメモリ改善が施されています。Anthropicの製品管理責任者であるダイアン・ナ・ペン氏は、トレーニングにおける全般的な長文コンテキスト品質の向上があったと述べています。コンテキストウィンドウの長さだけでなく、「記憶すべき適切な詳細を知ること」が重要であると強調されています。
これらの変更により、長らく要望されていた有料Claudeユーザー向けの「Endless Chat」機能も実現しました。この機能により、モデルがコンテキストウィンドウの限界に達しても、ユーザーに警告することなく、コンテキストメモリを圧縮しながら会話を継続できるようになります。
エージェント機能への展望
今回のアップグレードの多くは、エージェントとしての利用シナリオを視野に入れたものです。特に、OpusがHaikuを搭載したサブエージェント群を指揮するリードエージェントとして機能する場面が想定されています。ペン氏は、これらのタスク管理には強固なワーキングメモリが必要であり、今回のメモリ改善が真価を発揮すると述べています。「Claudeがコードベースや大規模なドキュメントを探索し、何かを後退して再確認するタイミングを把握できる能力が重要になる」と語られています。
競争激化するAI市場
Opus 4.5は、競争の激しいAI市場に投入されます。すでにOpenAIのGPT 5.1(11月12日リリース)やGoogleのGemini 3(11月18日リリース)といった他のフロンティアモデルがリリースされており、激しい競争が予想されます。
