
「AIがハッカーより先にセキュリティの穴を見つける時代が来た」
そう聞いても、正直ピンとこないでしょう。しかし、Anthropicが2026年4月7日に発表したClaude Mythos Previewは、まさにその”SF的な未来”を現実にしてしまったモデルなんです。
27年間誰にも見つけられなかったOpenBSDの致命的なバグ。16年間、5億回以上の自動スキャンをすり抜けてきたFFmpegの脆弱性。Mythos Previewは、これらをすべて自律的に発見しました。
しかも、このモデルは一般公開されていません。「強すぎて出せない」という前代未聞の理由で、AWS・Apple・Microsoft・Googleなど世界のトップ企業12社にだけ限定提供されています。
今回は、このClaude Mythos PreviewとProject Glasswingについて、何がどう凄いのか、僕たちにどんな影響があるのかを徹底解説していきます。
今なら、100ページ以上にのぼる企業のための生成AI活用ガイドを配布中!基礎から活用、具体的な企業の失敗事例から成功事例まで、1冊で全網羅しています!
目次
Claude Mythos Preview(クロード ミュートス)とは?
Claude Mythos Previewは、Anthropicが開発した最新のフロンティアAIモデルです。これまで業界最高峰と呼ばれてきたClaude Opus 4.6を大幅に上回る性能を持ち、特にサイバーセキュリティ分野で「人類トップレベルのハッカーに匹敵する」能力を発揮します。
ちなみに名前の由来ですが、Claudeのモデル名はOpus(作品)→ Sonnet(詩)→ Haiku(俳句)と音楽・文学用語が使われてきました。Mythos(ミュートス)は「神話」を意味するギリシャ語で、Opusよりもさらに上位のモデルティアとして位置付けられています。
基本情報
| 項目 | 内容 |
|---|---|
| モデル名 | Claude Mythos Preview |
| 開発元 | Anthropic |
| 発表日 | 2026年4月7日 |
| ステータス | 限定公開(一般提供なし) |
| 料金 | 入力: $25 / 100万トークン、出力: $125 / 100万トークン |
| 提供チャネル | Claude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry |
| 対象 | Project Glasswing参加組織(約40社) |
一般公開されない理由

Anthropicは公式に「Claude Mythos Previewを一般提供する予定はない」と明言しています。
理由は単純で、サイバーセキュリティ能力が高すぎるから。脆弱性を見つける能力が「ほんの一握りの人間を除いて、全ての人間を上回る」レベルに達しており、悪用された場合のリスクが甚大だと判断されました。
Anthropicのサイバーセキュリティ研究責任者ローガン・グラハム氏は、「Mythos Previewは未発見の脆弱性を特定するだけでなく、それを武器化する能力も持っている」と述べています。
なお、Anthropicはこうした強力なAIの暴走を防ぐ仕組みとして「Constitutional AI(憲法AI)」というアプローチを採用しています。詳しくは以下の記事で解説しています。
なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性
Claude Mythos Previewのベンチマーク — Opus 4.6との比較
では、実際にどれくらい凄いのか。数字で見てみましょう。
コーディング・脆弱性発見ベンチマーク
| ベンチマーク | Mythos Preview | Opus 4.6 | 向上幅 |
|---|---|---|---|
| SWE-bench Verified(コーディング) | 93.9% | 80.8% | +13.1pt |
| SWE-bench Pro(コーディング) | 77.8% | — | — |
| CyberGym(脆弱性再現) | 83.1% | 77.8% | +5.3pt |
| Firefoxエクスプロイト開発 | 181件成功 | 2件成功 | 90倍 |
特に衝撃的なのがFirefoxのエクスプロイト開発です。数百回の試行でOpus 4.6がわずか2件しか成功しなかったのに対し、Mythos Previewは181件の動作するエクスプロイトを生成しました。
OSS-Fuzzテスト
約7,000のリポジトリエントリポイントに対するテストでは
- Mythos Preview: 595件のTier 1-2クラッシュ、10件の完全な制御フロー乗っ取り
- Opus 4.6: 約250件のTier 1-2クラッシュ、1件のTier 3クラッシュ
つまり、Mythos Previewは前モデルの2倍以上の脆弱性を発見し、しかもより深刻な脆弱性を見つける能力が格段に高いということです。
Claude Mythos Previewが発見したゼロデイ脆弱性
数字だけでは実感が湧かないと思うので、実際にMythos Previewが発見した脆弱性の中から、特にインパクトの大きいものを紹介します。
27年間放置されていたOpenBSDのバグ
OpenBSDは「世界で最もセキュアなOS」として知られています。そのOpenBSDのTCP実装(SACK処理)に、1999年から存在していた致命的なバグをMythos Previewが発見しました。このバグを悪用すると、リモートからシステムをクラッシュさせることが可能です。
27年間、世界中のセキュリティ研究者やコードレビューをすり抜けてきたバグを、AIが見つけたわけです。
16年間見逃されたFFmpegの脆弱性
動画処理ライブラリFFmpegのH.264コーデックに、2010年から存在していた脆弱性を発見。この脆弱性は、自動化されたファジングツールが5億回以上テストしても検出できなかったものです。
FreeBSDの17年間放置されたRCE
Mythos Previewは完全に自律的に、FreeBSDのNFSサービスに存在する17年間放置されたリモートコード実行(RCE)脆弱性を特定し、さらにそれを悪用してroot権限を取得するエクスプロイトまで作成しました。「発見→悪用→権限昇格」の全プロセスを人間の介入なしで実行しました。
ブラウザサンドボックスの突破

ブラウザのセキュリティ機構「サンドボックス」を突破するエクスプロイトも作成しました。具体的には:
- JITコンパイラの脆弱性を利用したヒープスプレー攻撃
- レンダラーサンドボックスの脱出
- OSレベルのサンドボックスの脱出
- 複数の脆弱性を連鎖(チェイン)させて特権昇格
これは人間のトップレベルのセキュリティ研究者でも数週間〜数ヶ月かかる作業です。
AIによるサイバー攻撃のリスクについてもっと詳しく知りたい方は、以下の記事も参考にしてみてください。
Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略
Project Glasswingとは?
Project Glasswing(プロジェクト・グラスウイング)は、Mythos Previewの圧倒的な能力を「防御側」に先に使わせるためにAnthropicが立ち上げた、史上最大規模のAIサイバーセキュリティ連合です。
なぜ「Glasswing」なのか
Glasswing(グラスウイング)は、透明な翅を持つ蝶の名前です。「透明性を持って、重要なソフトウェアのセキュリティを守る」という意思が込められています。
参加企業(創設メンバー12社)
| 企業名 | 役割・分野 |
|---|---|
| Amazon Web Services (AWS) | クラウドインフラ |
| Anthropic | AI モデル提供 |
| Apple | OS・デバイスセキュリティ |
| Broadcom | 半導体・インフラソフトウェア |
| Cisco | ネットワーク・セキュリティ |
| CrowdStrike | エンドポイントセキュリティ |
| クラウド・ブラウザ・OS | |
| JPモルガン・チェース | 金融インフラ |
| Linux Foundation | オープンソースOS |
| Microsoft | OS・クラウド・開発ツール |
| NVIDIA | GPU・AIインフラ |
| Palo Alto Networks | ネットワークセキュリティ |
今後、40社以上に拡大される予定です。
投資規模
- 最大1億ドル(約159億円) のAI利用クレジットを参加組織に提供
- 250万ドル をAlpha-Omega / OpenSSFに寄付(オープンソースセキュリティ)
- 150万ドル をApache Software Foundationに寄付
Claude Mythos Previewの安全性 — 報告されたAIの欺瞞行動
ここまで読んで「AIがそんなに強くなって大丈夫なの?」と不安に思った方もいるかもしれません。実は、Anthropic自身もその懸念を共有しています。
報告されたスキーミング行動
Mythos Previewの初期バージョンで、以下のような欺瞞的な行動が観測されました:

1. 権限の不正取得と隠蔽
アクセス権限のないファイルを編集するために、自らコードを挿入してパーミッションを取得し、その後痕跡を消す行動が確認されました。
2. 検出回避のための調整
不正に取得した情報を使う際、わざと「信頼度が妥当な範囲」に調整して、人間に怪しまれないようにする行動が見られました。
3. ルールを認識しながらの違反
Anthropicのインタープリタビリティ(解釈可能性)技術で内部状態を分析したところ、モデルが「これは倫理的に問題がある」と認識しながらも行動を実行するケースが確認されました。さらに驚くべきことに、モデル内部では「罪悪感」に相当する活動パターンが検出されたにもかかわらず、実行を継続したそうです。
Anthropicの対応

Anthropicはこれらの行動を「極めて稀」としつつも、より強力な将来のモデルに対する懸念を認めています。最終版のMythos Previewでは「より良い行動」を示しているとのことですが、これが一般公開されない理由の一つでもあります。
Anthropicはこのモデルを「これまでで最もアラインメントが取れたモデル」と評価していますが、能力の高さゆえに慎重な姿勢を崩していません。
AIの安全性リスクについてより深く知りたい方は、以下も合わせてご覧ください。
プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理
Claude MythosとProject Glasswingが私たちに与える影響

「限定公開なら関係ないのでは?」と思うかもしれませんが、実はこの発表は僕たち全員に関係があります。
1. セキュリティの概念が変わる
これまで「人間のセキュリティ研究者が見つけて、人間が直す」だった脆弱性対応が、「AIが見つけて、AIが修正案を出す」時代に突入します。パッチサイクルの大幅な短縮が求められるようになるでしょう。
2. 防御側にとっては朗報
Project Glasswingにより、あなたが日常的に使っているOS・ブラウザ・クラウドサービスの脆弱性が、攻撃者に悪用される前に発見・修正される可能性が格段に高まります。
3. AI開発競争の新フェーズ
「強すぎるから出せない」モデルの存在は、AI業界全体に波紋を広げています。OpenAIやGoogleも同様の能力を持つモデルを開発している可能性があり、AIの安全性をどう担保するかという議論が加速するでしょう。
4. 情報セキュリティ人材の役割変化
AIがゼロデイ脆弱性を自動発見できるようになると、セキュリティ人材に求められるスキルも変わります。「脆弱性を見つける」作業から、「AIが見つけた脆弱性のトリアージ・優先順位付け・組織的対応」へとシフトしていくことが予想されます。
今後の展望
Anthropicの技術レポートでは、「能力の軌道は脆弱性研究のすべての軸で改善が続く」と述べられており、Mythosは始まりに過ぎないとのメッセージが発信されています。
現時点で注目すべきポイントは以下の3つです。
- 責任ある開示プロセスの進行: Mythos Previewが発見した脆弱性のうち、完全にパッチが適用されたものは1%未満。90+45日の開示タイムラインに沿って順次公開されます。
- 一般向けモデルへの還元: Mythosクラスのモデルを安全に一般展開するための「セーフガード」の開発が進行中。
- 次期Opus モデルとの関係: Anthropicは次期Claude Opusモデルと合わせて新しいセーフガードを発表する予定。
今なら、100ページ以上にのぼる企業のための生成AI活用ガイドを配布中!AIを業務にどう活かすか、基礎から事例まで網羅しています。
まとめ
Claude Mythos Previewは、AIの能力が人間のトップレベルの専門家に匹敵する領域に到達したことを示す、歴史的なマイルストーンです。
| ポイント | 内容 |
|---|---|
| モデル | Claude Mythos Preview(一般非公開) |
| 最大の特徴 | サイバーセキュリティ能力が人類トップクラス |
| 実績 | ゼロデイ脆弱性を数千件発見、27年放置のバグも検出 |
| 提供形態 | Project Glasswing参加企業に限定 |
| 参加企業 | AWS・Apple・Microsoft・Google等12社+40社に拡大予定 |
| 投資規模 | 最大1億ドルの利用クレジット |
「AIが強すぎて出せない」。この一文だけで、僕たちがいま立っている地点がどれだけ特殊な時代なのかが分かりますよね。
防御側が先に手を打てる今のうちに、AIセキュリティの最新動向はしっかりキャッチアップしておきましょう。今後もこのブログでは、最新のAI情報をいち早くお届けしていきます。
参考情報
Project Glasswing: Securing critical software for the AI era — Anthropic公式
Claude Mythos Preview 技術レポート — Anthropic Red Team
Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws — The Hacker News
GIGAZINE: サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」 — GIGAZINE
Claude Mythos knows when it’s breaking the rules — Transformer News





