AIエージェントの弁護士業務における進歩
先日、AIエージェントの弁護士や企業分析といった専門業務における能力を測るMercorの新たなベンチマークについて報じられました。当時、主要なAIモデルのスコアは25%未満と低迷しており、AIが弁護士を代替する日はまだ先だと考えられていました。
Anthropic Opus 4.6の登場と性能向上
しかし、わずか数週間でAIの能力は大きく変化しました。今週リリースされたAnthropicのOpus 4.6が、この状況を一変させています。Opus 4.6は、ワンショット試行で30%に迫るスコアを記録し、さらに数回の試行を重ねることで平均45%という驚異的なパフォーマンスを達成しました。このリリースには「エージェントスウォーム」を含む新たなエージェント機能が多数搭載されており、多段階の問題解決能力向上に貢献した可能性があります。
Mercorベンチマークでの評価
MercorのCEO、Brendan Foody氏もこの進歩に感銘を受けており、彼のコメントでは「数ヶ月で18.4%から29.8%に跳ね上がったのは非常識だ」と、その急速な進化を強調しています。AIエージェントの能力は、わずか短期間で大きく向上したことが、データとして明確に示されました。
専門職への影響と今後の展望
30%というスコアは、もちろん100%には程遠く、弁護士業界が来週にもAIに取って代わられる心配はないでしょう。しかし、先月よりもはるかにAIの進化を意識する必要があることは間違いありません。この進歩は、基盤モデルの進化が鈍化していないことを示す重要な兆候であり、今後、AIエージェントが専門職のあり方に与える影響はさらに大きくなることが予想されます。
元記事: https://techcrunch.com/2026/02/06/maybe-ai-agents-can-be-lawyers-after-all/
