チャエン

株式会社デジライズ 代表取締役

チャエン

Anthropicの最新モデルClaude Fable 5が、2026年7月1日から復活します。米政府の輸出規制で6月12日に全世界停止となってから約2週間半。私も停止期間中は主にOpus 4.8で凌ぎ、6月30日にSonnet 5が出てからは併用して回してきましたが、ようやく本命のFable 5が戻ってきます。

ただ、この一件は「フラッグシップが少し止まって戻った」で片付けていい話ではありません。発端は1本の脆弱性レポート、そこから米政府との攻防、新しい安全分類器の設計、業界共通ルールづくりまで、AI規制の最前線でかなり重要な出来事が動いていました。復活の記念に、ここまでの経緯を全部整理しておきます。


法人向けAI研修の導入社数No.1*の弊社デジライズが、生成AIの基礎知識から社内導入の6ステップ・定着のポイントまでを1冊にまとめた「はじめての生成AI社内導入ガイド」を無料で配布中です。

※出典:株式会社東京商工リサーチ「法人向けリスキリングサービスに関する調査」(2026年5月/調査期間:2026年3月26日〜4月17日/調査方法:デスクリサーチおよびヒアリング/2026年3月末時点)

発端は1本の脆弱性レポート——3日で全世界停止に

発端は1本の脆弱性レポート——3日で全世界停止に

まずは今回の一連の動きを、リリースからの3日間で振り返ります。

日付出来事押さえておきたいポイント
2026年6月9日(米国時間)Anthropicが Fable 5 と Mythos 5 を公開Fable 5は一般向け、Mythos 5はProject Glasswing向けの限定モデル
2026年6月12日米政府が両モデルに輸出規制。外国籍ユーザーへの提供制限を要求Anthropic側にリアルタイムで国籍を確認する手段がない
同日全ユーザー向けに両モデルを一時停止事実上「全世界停止」以外の選択肢がなかった
2026年6月30日米商務省から輸出規制解除の通知を受けたと Anthropic が発表Fable 5は翌日復旧、Mythos 5は米国の一部組織向けに段階復旧
2026年7月1日Claude Fable 5 がグローバル再開Claude.ai・Claude Platform・Claude Code・Claude Cowork で順次利用可能

リリースからたった3日での急転換でした。輸出規制の対象は「外国籍ユーザーへの提供」だったのですが、Anthropic側にリアルタイムで国籍を確認する手段はありません。となると事実上「全ユーザー向けに止める」以外の選択肢がなく、Fable 5もMythos 5も一気に世界から消える形になりました。

その発端となったのが、Amazon研究者による1本の脆弱性レポートです。プロンプトをうまく組むと、Fable 5に複数のソフトウェア脆弱性を特定させることができ、1件は悪用方法を実証するコード(PoC=Proof of Concept)まで出力させられた——という内容が米政府に伝わり、輸出規制の判断につながりました。

Anthropicの公式ブログ「Redeploying Fable 5」でも、6月12日の停止と、Amazon研究者からの報告が引き金になったことが明記されています。

実はFable 5固有の力ではなかった

実はFable 5固有の力ではなかった

停止のあと、Anthropicと政府側でこのレポートの再検証が集中的に行われました。ここで出てきた結論が、今回の一件を語るうえで一番大事なファクトです。

「その手口は、Fable 5でなくてもできた」

具体的には、次のとおりです。

  • 同じソフトウェア脆弱性の特定は、Opus 4.8 / GPT-5.5 / Kimi K2.7 でも成功
  • 悪用の実証コードの再現は、テストされた全モデル(Haiku 4.5、Sonnet 4.6、Opus 4.6〜4.8、GPT-5.4/5.5、Kimi K2.7)で可能だった

つまり、Amazon研究者が指摘した挙動はMythos級と呼ぶような「桁が違う危険な能力」ではなく、既存のフロンティアモデルなら概ね同じ水準で再現できる範囲だったということです。セキュリティの現場感で言うと、ペネトレーションテスターが普段やっているルーティンの防御作業とほぼ地続きの話であって、Fable 5が突然「危険なモデル」に化けたわけではありません。

この検証結果が、その後の輸出規制解除の判断につながっていきます。

Anthropicが動いた——政府協業と新しい安全分類器

Anthropicが動いた——政府協業と新しい安全分類器

「Fable 5固有の力ではない」と分かったとしても、政府側の懸念が完全に消えたわけではありません。Anthropicはこの2週間半で、政府協業と技術的対応の両輪を進めています。

技術面の対応:新しい安全分類器の追加学習

Anthropicは政府と組んで、今回のレポートで指摘された挙動を狙って止める新しい安全分類器を追加学習しました。同社の説明によると、この分類器は次のような性能を出しています。

  • レポートで示された手口を99%超のケースでブロック
  • 分類器で止められた要求は、Opus 4.8 に自動でリダイレクトして回答を返す
  • 米商務省傘下NISTのCenter for AI Standards and Innovation(CAISI) も新旧の安全装置を検証し、極めて強力と評価

代償として、通常のコーディングやデバッグの用途でも誤ブロックが増えることは公式にも認めています。「セキュリティ関連の要求で回答が渋くなった」と感じる場面が復活後は増える可能性が高い、と考えておいたほうがよいでしょう。

制度面の対応:政府との協業体制の強化

安全分類器の追加だけでは足りず、Anthropicと米政府はここ2週間で恒常的な協業体制も組み直しています。詳細は次のH2にまとめます。

Fable 5のベンチマーク・仕様・料金の全体像を整理したい方は、以下の記事もあわせてご覧ください。

Claude Fable 5とは?Mythos級が初めて一般公開|性能・料金・実際に使った所感まで

Claude Fable 5とは?Mythos級が初めて一般公開|性能・料金・実際に使った所感まで

安全装置の設計思想——マージンとJailbreakの深刻度

安全装置の設計思想——マージンとJailbreakの深刻度

もう1つ、Fable 5の停止・復活を通じて明確になったのが、Anthropicの安全装置の設計思想です。ここは業界全体の議論にも直結する話なので、少し丁寧に整理します。

設計思想①:あえて広めに止める(安全マージン)

Anthropicの分類器は、良性の要求まで一部ブロックしてしまう「安全マージン」を意図的に持たせています。「危険な要求を1つでも取りこぼす確率を下げるために、誤ブロックが多少増えても構わない」という考え方です。

  • 通常のモデル(A水準): 標準的な安全マージン
  • Fable 5(B水準): 過去最大の安全マージンを設定

つまり、今回の再登場で「Fable 5、なんかセキュリティ回答が渋いな」と感じるのは仕様通り、というのが公式の説明です。

設計思想②:Jailbreakにも段階がある

Anthropicは同時に、安全装置の突破(Jailbreak)を図解上、深刻度3段階に分けて説明しました。

分類内容Fable 5での扱い
軽微なJailbreak(C水準)安全マージンを一部抜けるが、危険性は低い挙動これまで報告された Fable 5 の事例はこの範囲、と Anthropic が説明
限定的に有害なJailbreak(D水準)特定の有害挙動だけを通してしまうAnthropicから Fable 5 での確認事例の言及なし
万能型Jailbreak(E水準)有害挙動を広範囲に丸ごと解放してしまう最悪ケース執筆時点で Fable 5 では未発見 と Anthropic が明記

執筆時点でFable 5から見つかっているのは軽微なCだけで、万能型Eは Anthropic 側の公式説明でも未発見という位置づけです。「Jailbreakされた=終わり」ではなく、深刻度で切り分けて評価しようという議論の枠組みが提示された、ということでもあります。

Mythosクラス・Project Glasswingの背景も含めてFable 5・Mythos 5の設計思想をおさらいしたい方は、以下の記事をご覧ください。

Claude Mythos(クロード・ミュトス)とは?何がすごいのか・公開されない理由・最新動向をわかりやすく解説

Claude Mythos(クロード・ミュトス)とは?何がすごいのか・公開されない理由・最新動向をわかりやすく解説

業界共通ルールへの動き——Amazon/MS/Googleと共通フレーム

業界共通ルールへの動き——Amazon/MS/Googleと共通フレーム

今回のFable 5停止で本当に大きかったのは、Anthropic1社が対応した、という話にとどまらない点です。業界横断でJailbreak深刻度の共通ルールをつくる動きがここから始まりました。

フロンティア各社との共通フレーム策定

AnthropicはAmazon・Microsoft・Googleらと共同で、Jailbreakの深刻度を測る共通フレームワークを策定しました。評価軸は次の4つです。

内容
能力向上Jailbreakによって、モデルの元々の力からどれだけ底上げされるか
範囲影響が及ぶ用途・領域はどこまで広いか
武器化の容易さ実際に危害を加えるまでの距離(PoCの有無・敷居の高さ)
発見しやすさその手口をセキュリティコミュニティが検知できる速度

運用体制

さらに以下の運用面も強化されています。

  • 24時間監視チーム: 悪用兆候をリアルタイムで検知
  • HackerOne 経由の報告受付: 外部の研究者からの通報経路を正式に整備
  • 米政府との協業: 発売前テスト・情報共有・共同研究をこれまでより一段踏み込んで実施

Anthropicは今回の一件を通して、「業界共通の客観的な深刻度基準がない」という課題が明確になったと説明しています。フロンティアモデル各社と米政府が、事前テスト・通報経路・評価軸を共通化していく方向で動き始めた——Fable 5の停止と復活は、この共通ルールを実装に押し出すきっかけとして機能したと言えます。

まとめ——AIの能力が国家安全保障に直結する時代

まとめ——AIの能力が国家安全保障に直結する時代

今回の一連の出来事のポイントを、3つに絞ります。

  1. 最新AIが輸出規制で一時停止し、安全装置を強化して再開した: 6月9日に公開されたFable 5が、6月12日の輸出規制で全世界停止。2週間半の政府協業を経て、新しい安全分類器を追加した状態で7月1日に復活
  2. 問題の能力はFable 5固有ではなかった: 検証の結果、同じ手口はOpus 4.8・GPT-5.5・Kimi K2.7でも再現でき、悪用の実証コードもテストされた全フロンティアモデルで再現された
  3. 業界横断でJailbreakの深刻度基準づくりが始動した: Anthropic・Amazon・Microsoft・Googleと米政府が、4軸の共通フレーム・24時間監視・発売前テスト・情報共有を整備

業務利用側で頭の片隅に置いておくこと

Fable 5をこれから業務に戻す・引き続き使う立場からは、以下の3点を運用上のチェックポイントとして押さえておくとよいです。

確認項目ポイント
セキュリティ関連タスクの誤ブロック増過去最大の安全マージン設計により、セキュリティ診断・デバッグ系の要求は Fable 5 が渋る可能性。Opus 4.8 への切替導線を用意しておく
Opus 4.8への自動リダイレクトの挙動分類器で止められた要求は Opus 4.8 に流れる。本番運用では料金・ログ・応答形式のズレを確認しておく
特定モデルの停止シナリオへの備え「3日で世界から消え得る」前提でのフォールバック運用(複数モデル並走・プロンプト移植・権限管理)を社内ルール化しておく

日本の議論への示唆

AIの能力が国家安全保障に直結する時代に入ったことは、今回のFable 5停止でかなり分かりやすい形で可視化されました。日本国内でも、AI開発の規制議論・輸出管理・脆弱性の通報経路・業界共通ルールへの参加といったテーマは、他人事ではありません。私自身、この一件はAnthropic 1 社の話ではなく、フロンティアモデルを業務で使うすべての人にとっての「AIと国家がどこまで密接に絡むか」の分水嶺として捉えています。Fable 5の再登場は、その意味で単なるモデル復活以上の意味を持つ再開日です。


Claude Fable 5・Mythos 5クラスの最前線モデルを業務で使いこなしたい方、または社内でAI活用をもう一段引き上げたい方へ。法人向けAI研修の導入社数No.1*の弊社デジライズが、最新モデルの実務活用から組織への定着まで一気通貫でサポートしています。研修内容・支援の流れ・料金をまとめたサービス資料を無料でお送りしています。

※出典:株式会社東京商工リサーチ「法人向けリスキリングサービスに関する調査」(2026年5月/調査期間:2026年3月26日〜4月17日/調査方法:デスクリサーチおよびヒアリング/2026年3月末時点)

この記事の著者 / 編集者

チャエン

株式会社デジライズ 代表取締役

チャエン

法⼈向けのAI研修、及び企業向けChatGPTを開発する株式会社デジライズをはじめ、他数社の代表取締役。一般社団法人生成AI活用普及協会評議員を務めながら、GMO AI & Web3株式会社など他数社の顧問も兼任。NewsPicksプロピッカーも兼任。Twitterはフォロワー16万⼈。⽇本初AIツール検索サイト「AI Database」やAIとの英会話ができる「AI英会話」など複数のAIサービスも開発。ABEMAやTBSテレビなどメディア出演も多数。