Claude Opus 4.7 xhighとは — 従来effortとの違いとコスト試算

要点

Claude Opus 4.7の登場に合わせて、Extended Thinkingのeffortパラメータにxhighという新しいレベルが追加されました。従来のlow/medium/highに加わる最上位のレベルで、Opus 4.7でのみ有効な設定です。同時に、Opus 4.7世代からはbudget_tokensによる手動指定が廃止され、effortによる指定(adaptive thinking)が唯一の経路になりました。xhighの特性、従来レベルとの使い分け、コスト試算の考え方、そしてClaude Code・Claude.ai・APIでの指定方法を順に見ていきます。

xhighとは何か

xhighは、Opus 4.7のadaptive thinkingで指定できる最大の推論努力レベルです。Extended Thinkingのeffortパラメータは以下の4段階が定義されています。

low: 最小限の推論。シンプルなタスク向け
medium: バランス型の推論(既定値)
high: 複雑な問題のための深い推論
xhigh: 最大の推論努力(Opus 4.7専用)

従来のhighとの違いはドキュメント上「最大の推論努力」とのみ表現されており、具体的なトークン上限の数値は公開されていません。adaptive thinkingではeffortがモデル側に必要な思考量を決めさせるシグナルとして働き、xhighはその上限を押し上げる役割を持ちます。既存のhighよりもう一段 "時間をかけて考える余地を与えた" レベル、という位置づけと言えそうです。

注意点として、Opus 4.7以外のモデルにxhighを指定するとエラーになるか、Claude Codeのように上位ツールがhighへフォールバックさせます。モデルを動的に切り替えるコードベースでは、xhigh指定時のガードが必要です。

もう一つの大きな変更が、Opus 4.7でmanual extended thinking(thinking: {type: "enabled", budget_tokens: N})が廃止されたことです。Opus 4.7に対してbudget_tokensを渡すと400エラーになります。Opus 4.6以降で推奨されていたadaptive thinkingへの一本化が、Opus 4.7で完了した形です。

どんなタスクで効くのか

xhighが効きやすいのは、思考ステップの多さや厳密性がそのまま品質に直結するタスクです。ドキュメントやリリースノートから読み取れる範囲で、5つのパターンに分けて並べると次の通りです。

1. 大規模コードベースのリファクタリング設計

依存関係の広いリポジトリで、複数ファイルにまたがる変更の影響を先読みしながら計画を立てるケースです。考慮すべき制約が多く、highでは議論が浅くなりがちな領域でxhighが効きやすいと言えそうです。

2. 難易度の高いアルゴリズム/数学的証明

競技プログラミング級の難問や、数式展開を伴う証明課題では、xhighにより探索空間を広く取った推論が期待できます。Anthropicの発表でも、Opus 4.7全般としてコーディング・エージェント・多段タスクの性能向上が明示されています。

3. 金融/法務などドメイン固有の多段推論

規制・条文・計算式が絡む分析では、前提の食い違いが致命的になるため、xhighで一度にじっくり検証させる価値があります。同社の発表でも、コード品質・金融分析・法務文書処理における改善が言及されています。

4. エージェントの長期タスク計画

複数ツールを横断して動くエージェントの初期計画段階でxhighを使い、その後の実行ステップはmediumに落とすハイブリッド運用が考えられます。Opus 4.7はツール結果受信後の再思考(interleaved thinking)をネイティブサポートするため、計画→実行→再計画のループと相性が良好です。

5. 高品質コードレビュー/監査系ワークロード

PRレビューやセキュリティ監査は、指摘の網羅性が価値を決めるタスクです。Claude Codeの/ultrareviewのような並列マルチエージェント基盤と組み合わせた場合、各エージェントにxhighを与えるだけでレビュー粒度が上がる可能性があります。

逆にxhighが過剰になりやすいタスクも明確です。短文翻訳、定型的なドキュメント整形、テンプレートの穴埋め、シンプルなクラス名変更のような作業では、mediumやlowで十分な品質が出せます。

コスト試算

Extended Thinkingの課金は「実際に生成された思考トークン(full thinking tokens)に対して課金される」という原則があります。displayをsummarizedやomittedにしても、見えない部分の思考トークンは出力トークンとして課金されます。Opus 4.7の料金は前世代から据え置きで、入力100万トークンあたり5ドル、出力100万トークンあたり25ドルです(Anthropic発表値)。

xhighとhighのトークン消費比は公開されていないため、ここでは仮の係数で試算します(実測ではなく思考実験であることを前置きしておきます)。

アルゴリズム実装の設計(本文出力3,000トークン想定)

effort	思考トークン(仮)	合計出力	概算コスト(USD)
`high`	20,000	23,000	約0.58
`xhigh`	40,000	43,000	約1.08

PRレビュー(本文出力2,000トークン想定)

effort	思考トークン(仮)	合計出力	概算コスト(USD)
`high`	15,000	17,000	約0.43
`xhigh`	30,000	32,000	約0.80

仮にxhighがhighの約2倍の思考トークンを使うと仮定した場合、1リクエストあたりのコストもおおむね2倍弱に膨らむ計算になります。日次数百リクエストのパイプラインでhigh→xhighに一律切り替えると、数十ドル/日の差が出得る規模感です。

なお、adaptive thinkingはモデル側が必要な思考量を動的に決めるため、xhighを指定しても簡単なタスクでは少ない思考量で済むはずです。「xhigh=常にhighの2倍払う」ではなく、「必要なときに2倍まで払える上限枠」と捉えたほうが実態に近いと言えそうです。従来のbudget_tokensで上限を明示していた世界との大きな違いです。

Claude Code / Claude.ai / APIでの使い方

Claude Codeでは、Claude Code v2.1.111でxhighサポートが追加されました。対話モードでは/effortコマンド、起動時は--effort xhighフラグ、環境変数ではCLAUDE_CODE_EXTRA_BODY経由で指定できます。詳細はv2.1.111のリリースノートに整理されています。

# 対話モードで切り替え
/effort
 
# CLI引数で指定
claude --effort xhigh
 
# 環境変数で指定
CLAUDE_CODE_EXTRA_BODY='{"output_config":{"effort":"xhigh"}}' claude

Claude Code側では、Opus 4.7以外のモデルにxhighを指定した場合はhighにフォールバックします。モデル切り替えを伴うワークフローでも安全側に倒れる仕様です。

Claude.aiでは、モデルとしてOpus 4.7を選んだ上で、UIのEffortピッカーからxhighを選択する形式です(Max契約でAuto modeを使っている場合、Claude側が自動でxhighを選ぶ機会もあります)。

APIでは、thinking.type: "adaptive"とthinking.effort: "xhigh"を指定します。Opus 4.7以外でxhighを指定するとエラーになる点、およびbudget_tokensを併用しようとするとOpus 4.7では400エラーになる点に注意が必要です。

response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=16000,
    thinking={
        "type": "adaptive",
        "effort": "xhigh",
    },
    messages=[
        {"role": "user", "content": "複雑な数理証明を解いてください..."},
    ],
)

ツール使用との併用では、tool_choiceがautoまたはnoneに限定される点、thinkingブロックをそのまま次ターンに引き継ぐ必要がある点は従来通りです。Opus 4.7ではツール結果受信後のinterleaved thinkingがベータヘッダなしで動作するため、エージェント側の実装はシンプルになります。

xhighが登場した背景と今後の展望

xhighは、adaptive thinkingへの一本化と並行して登場したという文脈が重要です。Opus 4.6世代までは「manual thinking(budget_tokensで上限を明示)」と「adaptive thinking(effortでレベル指定)」が併存していました。Opus 4.7ではmanualが廃止され、表現の解像度はeffortの段階数に依存する形になります。

そう考えると、low/medium/highの3段階だけでは上限側の表現力が不足する — 特にhighの上にもう一段、ユーザーが意図的に指名したい領域がある、というのがxhighの必然性と言えそうです。manual廃止の副作用としての追加、というよりadaptive時代における budget_tokens=最大 の代替として設計されたと解釈するのが自然です。

今後の展望としては、以下の2方向が想像されます(推測を含みます)。

effort段階の細分化: xhighの上にさらに上位段階が増えるか、各段階の中間値が加わる可能性
Auto modeとの統合深化: Claude側がxhighを自動で選ぶ条件をユーザーに開示し、明示指定と自動選択の役割分担が整理される方向

いずれにせよ、ユーザー側で直接budget_tokensを数値でいじる時代は終わりつつあり、「意図(effort)を伝えてモデルに任せる」という抽象化の方向に進んでいると言えそうです。

使いどころの判断早見表

タスク種別ごとに、推奨effortレベルとxhighを使う価値の目安を並べると次の通りです。

タスク種別	推奨effort	xhighを使う価値
短文翻訳・要約	`low`	低い
ドキュメント整形・テンプレ穴埋め	`low` / `medium`	低い
既存関数のリネーム・小規模修正	`medium`	低い
通常の機能実装・バグ修正	`medium` / `high`	中
PRレビュー(通常規模)	`high`	中
PRレビュー(大規模/監査)	`xhigh`	高い
アーキテクチャ設計・技術選定	`xhigh`	高い
数理証明・難問アルゴリズム	`xhigh`	高い
金融/法務の多段推論	`xhigh`	高い
エージェントの長期タスク計画	`xhigh`(計画時のみ)	高い

判断の軸としては「間違えた場合のコストが、2倍のトークン料金より大きいか」を目安にすると実運用で迷いにくい印象があります。個人開発や試作ではmedium/highを既定にし、本番投入前のレビューや設計フェーズでxhighに切り替える、といった段階的な使い方がバランスを取りやすそうです。

まとめ

Opus 4.7のxhighは、Extended Thinkingがadaptive thinkingに一本化される流れの中で登場した、最大の推論努力を指示するためのハンドルです。従来のbudget_tokensによる数値指定が廃止された代わりに、effortの段階表現で意図を伝える設計になりました。常用するものではなく、間違いのコストが高い局面でピンポイントに使う道具として捉えるとコスト面でも納得感が出やすい位置づけです。Claude Code v2.1.111以降では対話モード・CLI・環境変数のいずれからも指定でき、Claude.aiやAPIでも同じ効果が得られます。タスク種別とxhighを使う価値を照らし合わせながら、既存のワークフローに段階的に組み込んでいく運用が現実的と言えそうです。

関連:Claudeモデルの選び方ガイドとPrompt Cachingの仕組みと適用判断を併読すると、xhighモードの運用判断が立体的になります。

Claude Opus 4.7 xhighとは — 従来effortとの違いとコスト試算

要点

xhighとは何か

どんなタスクで効くのか

コスト試算

Claude Code / Claude.ai / APIでの使い方

xhighが登場した背景と今後の展望

使いどころの判断早見表

まとめ

関連する記事

Claudeとは — Opus 4.7 / Sonnet 4.6 / Haiku 4.5の使い分け完全ガイド(2026年5月版)

Claude Opus 4.7が登場 — コーディング・エージェント・ビジョンを底上げした最上位モデル

Anthropic APIのPrompt Cachingを理解する — コスト削減の仕組みと適用判断

Teaching Claude why — Anthropicが「行動」より「理由」を教えるアラインメント訓練の中身

Anthropic 2026年春の3本柱 — Opus 4.7 / Cowork GA / Claude Designを読み解く

Natural Language Autoencoders — Claudeの活性化を「日本語(自然言語)」で読むAnthropicの新解釈手法

AnthropicのApril 23 Postmortem — Claude品質低下を3つの独立バグから読み解く

Automated Alignment Researchers — Claudeにアラインメント研究をさせる実験と、その9体が出した0.97という数字