本文へスキップ
Claude Media
Claude Opus 4.7が登場 — コーディング・エージェント・ビジョンを底上げした最上位モデル

Claude Opus 4.7が登場 — コーディング・エージェント・ビジョンを底上げした最上位モデル

AnthropicがClaude Opus 4.7を4/16に一般提供開始。Opus 4.6と比べてコーディング解決率は13%、本番タスクは3倍、視覚タスクは98.5% へ改善し、価格は据え置きです。

読了目安 約5

要点

2026年4月16日、Anthropicは最上位モデルClaude Opus 4.7を一般提供開始しました。Opus 4.6からコーディング・エージェント・ビジョンの3領域でまとまった性能向上があり、価格は据え置き(入力100万トークンあたり5ドル、出力100万トークンあたり25ドル)です。

  • コーディング: 93タスクの社内ベンチで解決率がOpus 4.6比 +13%、Rakuten-SWE-Benchの本番タスク解決数は約3倍
  • エージェント: Finance Agent評価とGDPval-AA(経済価値のある知的労働)でstate-of-the-art
  • ビジョン: 長辺2,576ピクセル(約3.75メガピクセル)まで受理、従来の3倍超の解像度。XBOW視覚精度ベンチで54.5% → 98.5%
  • 提供: Claude API(claude-opus-4-7)/ Claude.ai / Claude Code / Amazon Bedrock / Google Cloud Vertex AI / Microsoft Foundry

新しい思考レベル xhigh、Claude Code内の /ultrareview スラッシュコマンド、Task budgetsのパブリックベータも同時に到着しています。xhigh の挙動とコスト試算はOpus 4.7 xhighの使い分けにまとめています。

あなたの開発フローはどう変わるか

コーディング: 難しいPRほど効きやすい

AnthropicはOpus 4.7を「advanced software engineeringでの顕著な改善」と位置付けています。ベンチ上の数字は次のとおりです。

ベンチマークOpus 4.6Opus 4.7
93タスクの社内コーディングベンチ(解決率)+13ポイント改善
Rakuten-SWE-Bench(本番タスク解決数)約3×
CursorBench(クリアランス)58%70%

「短時間で済む小さな修正」での差は出にくい一方で、長時間の探索や厳密な検証が必要なPRほどOpus 4.7の伸びが効くタイプの差分です。Claude Code上のレビュー / 設計 / リファクタリング系ワークフローを多用しているチームは、/ultrareview と組み合わせて差を体感しやすい更新と言えそうです。Claude Code自体の使いこなしはClaude Code完全ガイド2026を参照してください。

エージェント: 長時間・多段タスクの一貫性が伸びている

AnthropicはOpus 4.7を「複雑で長時間に及ぶタスクを厳密かつ一貫して扱える」と説明しています。Finance Agent評価とGDPval-AAでstate-of-the-artを取った点は、単発推論ではなく多段ツール呼び出し + 中間状態の管理が評価軸となるベンチでの優位を示しています。

実装側では、ツール結果受信後のinterleaved thinking(思考と実行の交互ループ)が同世代でネイティブサポートされており、計画 → 実行 → 再計画のループが書きやすくなっています。Task budgetsのパブリックベータは、エージェントに「ここまでの予算で成果を出してほしい」という上限を渡せる仕組みで、長時間タスクのコスト管理面の不安を緩和する追加です。

ビジョン: 図表・回路図・チャート読みの精度が現実水準へ

ビジョンの強化は数字に強く出ています。XBOWの視覚精度ベンチでOpus 4.6が54.5% だったところ、Opus 4.7は98.5%。Anthropicは化学構造式や技術図の読み取り改善を例として挙げています。

  • 受理画像の長辺が2,576ピクセル(約3.75メガピクセル)まで拡張(従来の3倍超)
  • 高解像度のままモデルへ渡せるため、PDFキャプチャ / 設計図 / グラフのリサイズロスが減少

「画像で渡したいが解像度が足りずに崩れる」問題に当たっていた、ドキュメント解析・回路図レビュー・データ可視化分析あたりの用途は現実的に乗り換える価値が出てくる更新です。

背景・文脈

Sonnet 4.6 / Haiku 4.5との関係

Anthropicは2025年からOpus(最上位)/ Sonnet(主力)/ Haiku(高速・低価格)の3段階構成でモデルを刻んでおり、Opus 4.7はそのうち最上位枠の刷新にあたります。Sonnet 4.6やHaiku 4.5は今回の発表で直接アップデートされたわけではなく、ラインナップ全体ではなく上位の1枠だけが入れ替わった構図です。

価格は前世代(Opus 4.6)と完全に同額で据え置かれており、料金面で既存のOpusユーザーが切り替える阻害要因が少ない設計と読めます。Sonnetと比べると1桁高い単価帯のままなので、コスト感度の高いワークロードは引き続きSonnet 4.6を主力に置き、設計レビューや厳密性が求められる局面でOpus 4.7を呼ぶ、といった併用が現実的です。

容量側との接続

直近のAnthropicは、計算容量の大型確保(SpaceX Colossus 1 + Amazon 5GW + Google/Broadcom 5GW)中堅企業向け実装会社の設立を矢継ぎ早に発表しています。Opus 4.7のローンチは、この「容量を確保した上で上位モデルを刷新し、配送網を太くする」流れの中央に置かれた発表です。

トークナイザー更新と移行時の注意

Opus 4.7ではトークナイザーが更新され、内容によって入力トークン数が約1.0〜1.35倍に増えるとアナウンスされています。料金単価が同じでも、長文入力中心のワークロードでは実費が数〜30% 程度上振れる可能性があります。コスト見積もりの再校正は移行前にやっておきたい点です。

セーフティ面では、Opus 4.6と同等のプロファイルを維持しつつ、誠実性とプロンプトインジェクション耐性で改善があるとされています。サイバーセキュリティ用途は禁止 / 高リスク用途の自動検出 + ブロックが入っており、脆弱性研究やペネトレーションテストといった正当用途はサイバー検証プログラム経由で利用する運用に整理されています。

上位1枠の刷新が示す「Opusは厳密性で稼ぐ」路線

Opus 4.7のベンチ表を眺めて目を引くのは、Sonnetと差別化される軸が「厳密性」「長時間タスクの一貫性」「視覚精度」に寄っている点です。短文の応答速度や日常的な対話品質ではなく、「間違ったときのコストが大きい場面で勝つ」方向に振り切った数字の出し方になっています。

指標カテゴリ性質Opus 4.7が伸ばした軸
単発の応答品質Sonnetで十分
多段タスクの一貫性エージェント運用で重要Finance Agent / GDPval-AAでSOTA
視覚タスクの精度ドキュメント解析で重要XBOW 54.5% → 98.5%
難PRの解決率エンジニアリング深部93タスクで +13pt

xhigh という新しい思考レベルがOpus 4.7専用で導入されたことも、この路線と整合します。「最大の推論努力を指示するハンドル」を上位モデルだけに付与することで、用途を「思考量が結果の質に直結する難タスク」へ自然に誘導する設計です(xhigh 自体の詳細は専用記事を参照)。

つまり、SonnetとOpusを価格差だけで判断せず、「どの軸の品質に賭けたいか」で使い分ける時代に入った、という編集視点での整理ができそうです。

まとめ

  • コーディング / エージェント / ビジョンの3領域でまとまった改善、価格は据え置き
  • 効くのは難PR・長時間エージェント・高解像度ドキュメント解析といった、間違いのコストが高い領域
  • 上位1枠の刷新で、Sonnet 4.6 / Haiku 4.5はそのまま継続。コスト感度の高い用途は引き続きSonnetを主力に
  • 移行時はトークナイザー更新による入力トークン増(最大1.35倍)のコスト再校正を検討
  • 思考量を最大化する xhigh を併せて導入、Claude Code上では /ultrareview とTask budgetsベータも到着

具体的なベンチ結果はさらにユースケース別の比較が出てくる見込みで、自社のワークロードでどこに効くかは小さく試して見極める段階です。

この記事を共有:XLinkedIn