Claude Fable 5が18日ぶりに復帰：Anthropicが封じたのはジェイルブレーク技術であり、モデルそのものではない

AnthropicがこれまでリリースしたAIモデルの中で最も高性能なClaude Fable 5が、世界全体で再び利用可能になった。今回の復帰は18日間の完全停止を経てのことだ。米国政府がAnthropicに対してユーザーの国籍をリアルタイムで確認するよう求める輸出規制を課した際、Claudeのグローバルなユーザー規模ではその要件を満たすことが技術的に不可能と判断した同社は、部分的な遵守より完全な利用停止を選んだ。

規制を引き起こしたのは、Amazonの研究者が発見した特定のジェイルブレーク手法だった。この手法はFable 5を使い、米国の輸出規制が特定の外国人に禁じる形でソフトウェアの脆弱性をマッピングするものだった。内部調査で判明したのは、規制上の論理を複雑にする事実だった。同種の脆弱性は、Opus 4.8、GPT-5.5、Kimi K2.7といったはるかに性能の低いモデルでも特定できることがわかったのだ。つまり、この能力はFable 5に固有のものではなかった。

輸出規制を解除した修正

何が変わったかというと、Amazonが文書化した迂回技術を特定してブロックするよう専門的に訓練された新しい安全分類器の導入だ。Anthropicによれば、この分類器は公開された手法を99%以上のケースで検出する。これはFable 5が今後のジェイルブレークから完全に保護されるという保証ではなく、既知の脆弱性に対する的を絞った修正だ。分類器は入力層で機能し、文書化されたパターンに合致するリクエストをモデルが処理する前に別ルートへ振り分ける。

AI規制の今後の展開を考えると、より広い含意がある。Fable 5に輸出規制が適用されたのは、このモデルだけが損害を可能にしていたからではなく、既知の技術がそれを悪用していたからだ。規制が解除されたのも、規制の枠組みがその問題を解決したからではなく、分類器が文書化された抜け穴を閉じたからだ。Anthropicはアマゾン、マイクロソフト、グーグルと協力し、AIジェイルブレークの深刻度を4基準——能力獲得、その広がり、兵器化の容易さ、発見可能性——で評価する共通フレームワークの策定に取り組んでいる。このフレームワークはまだ公開標準として存在しない。

モデルの性能とコスト

モデル自体に変更はない。Fable 5は高度な長期推論とエージェント的な作業向けに設計されており、各ステップでの人間の承認なしに長いシーケンスにわたって計画、実行、軌道修正が必要なタスクを対象としている。コンテキストウィンドウは100万トークンで、これがデフォルト値でもある。応答あたりの最大出力は128,000トークン。思考は常に有効化されており、生の推論チェーンではなく読みやすい要約として返される。

アクセスには停止前には存在しなかった条件が伴う。Fable 5はデータを30日間保持することを要件とし、ゼロデータ保持契約のもとでは利用できない。医療、法律、行政機関ではゼロ保持契約がAI導入の基本要件となっていることが多く、これは直接的な影響を及ぼす。料金はOpusレベルを超える水準だ——入力100万トークンあたり10ドル、出力100万トークンあたり50ドル。安全分類器を作動させたリクエストは拒否される代わりにフォールバックモデルで対応される場合があり、その切り替えがエンドユーザーに見えるかどうかは各オペレーターの設定次第だ。

利用可能性

Fable 5には姉妹モデルとしてClaude Mythos 5があり、基本能力と価格は同じだが、Fable 5にはない攻撃的なサイバーセキュリティ機能を備えている。Mythos 5は別アクセス層であるProject Glasswingを通じて提供される。2つのモデルは同時に復帰したわけではない——Mythos 5は、Fable 5のグローバル復帰の1週間前に一部の米国組織向けにアクセスが回復していた。

Fable 5は現在、ClaudeプラットフォームとClaude.ai、Claude Code、Claude Coworkで利用可能だ。Pro、Max、Team、および一部のEnterpriseプランでは、7月7日まで週間利用上限の50%に含まれ、その後は利用クレジット制への移行となる。AWS、Google Cloud、Microsoft Foundryを通じたアクセスは段階的に復元されている。次の新たな迂回技術が登場したときの対処を規定するフレームワークは、まだ構築途上にある。

タグ: 人工知能, Anthropic, Claude, AI safety, Fable 5, AI regulation