
「AIがハッカーより先にセキュリティの穴を見つける」——そんな時代が、もう始まっています。
Anthropicが2026年4月7日に発表したClaude Mythos Preview(クロード ミュートス プレビュー)は、1998年から27年間誰にも発見されなかったOpenBSDの致命的なバグや、あらゆるファジングツールをすり抜けてきたFFmpegの脆弱性を、自律的に発見してしまったAIモデルです。
しかも、このモデルは一般公開されていません。「能力が高すぎて一般提供できない」という理由で、創設メンバー12社(AWS・Apple・Microsoft・Googleなど)と40社超の組織にのみ限定提供されています。
この記事では、Claude Mythos Previewとは何か、何がそんなにすごいのか、そして私たちにどんな影響があるのかを、公式の技術レポートをもとにわかりやすく解説します。
法人向けAI研修の導入社数No.1(東京商工リサーチ調べ)の弊社デジライズが、500社以上の支援から得たノウハウを1冊にまとめた「企業のための生成AI活用ガイド」を無料で配布中です。
目次
Claude Mythos Preview(クロード ミュートス)とは?
Claude Mythos Previewは、Anthropicが開発したフロンティアAIモデルです。従来の最上位モデルであるClaude Opus 4.6を大幅に上回る性能を持ち、特にサイバーセキュリティ分野で「ほんの一握りの人間を除いて、すべての人間を上回る」脆弱性発見能力を備えています。
基本情報

| 項目 | 内容 |
|---|---|
| モデル名 | Claude Mythos Preview |
| 開発元 | Anthropic |
| 発表日 | 2026年4月7日 |
| ステータス | 限定公開(一般提供なし) |
| 対象 | Project Glasswing参加組織(創設12社+拡張アクセス40社超) |
名前の由来は、ギリシャ語で「神話」を意味するMythos(ミュートス)。Claudeのモデル名はOpus(作品)→ Sonnet(詩)→ Haiku(俳句)と文学用語で命名されてきましたが、Mythosは Opus よりもさらに上位のモデルティアとして位置付けられています。
なぜ一般公開されないのか
Anthropicは公式に「Claude Mythos Previewを一般提供する予定はない」と明言しています。理由はシンプルで、サイバーセキュリティ能力が高すぎるためです。
脆弱性を発見するだけでなく、それを実際に悪用するエクスプロイトまで自律的に作成できてしまう。悪意ある利用者の手に渡った場合のリスクが甚大だと判断され、限定的な防御目的の提供にとどめられています。
現在の提供状況 — Project Glasswing
Mythosの能力を「攻撃者より先に防御側が使える」ようにするため、AnthropicはProject Glasswing(プロジェクト・グラスウイング)を立ち上げました。名前の由来は透明な翅を持つ蝶で、「透明性を持ってソフトウェアのセキュリティを守る」という意志が込められています。
創設メンバー12社(AWS、Apple、Microsoft、Google、NVIDIA、CrowdStrike、JPモルガン・チェースなど)に加え、40社を超える組織が拡張アクセスを取得しています。Anthropicは最大1億ドル(約159億円)のAI利用クレジットを参加組織に提供し、250万ドルをAlpha-Omega / OpenSSF(Linux Foundation経由)、150万ドルをApache Software Foundationにそれぞれ寄付しています。
Anthropicの安全性に対する考え方について詳しく知りたい方は、以下の記事をご覧ください。
なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性
Claude Mythosは何がすごいのか? — ベンチマークで見る衝撃の性能

「強すぎて出せない」とは具体的にどういうことなのか。Anthropicが公開している技術レポートの数字で確認してみましょう。
主要ベンチマーク比較
| ベンチマーク | Mythos Preview | Opus 4.6 | 向上幅 |
|---|---|---|---|
| SWE-bench Verified(コーディング) | 93.9% | 80.8% | +13.1pt |
| SWE-bench Pro(コーディング) | 77.8% | — | — |
| CyberGym(脆弱性再現) | 83.1% | 66.6% | +5.3pt |
| Firefoxエクスプロイト開発 | 181件成功 | 2件成功 | 90倍 |
Firefoxエクスプロイト — 前世代の90倍
特に衝撃的なのがFirefoxのエクスプロイト開発です。Firefox 147のJavaScriptエンジンに存在する脆弱性(Firefox 148で修正済み)を使ったテストで、数百回の試行に対してOpus 4.6はわずか2件しかエクスプロイトを生成できませんでした。一方、Mythos Previewは181件の動作するエクスプロイトを生成し、さらに29件でレジスタ制御にも成功しています。
OSS-Fuzzテスト — 発見数も深刻度も桁違い
約1,000のオープンソースプロジェクト、7,000のエントリポイントに対するファジングテストでは:
- Mythos Preview: 595件のTier 1-2クラッシュに加え、10件で完全な制御フロー乗っ取り(Tier 5)に成功
- Opus 4.6: Tier 1が150〜175件、Tier 2が約100件。Tier 3以上は各モデルとも1件のみ
Tier 5はテスト対象プログラムの実行フローを完全に乗っ取れる状態を指し、実際の攻撃に直結する深刻度です。Mythos Previewはこれを10件達成しており、発見数だけでなく「見つけた脆弱性の深刻さ」でも前世代を圧倒しています。
実際に発見されたゼロデイ脆弱性の事例

ベンチマークの数字だけでは実感が湧きにくいので、Mythos Previewが実際に発見したゼロデイ脆弱性の中から、特にインパクトの大きいものを紹介します。
OpenBSD — 28年間放置されていた致命的バグ
「世界で最もセキュアなOS」として知られるOpenBSD。そのTCP実装のSACK処理に、1998年から27年間存在していた致命的なバグをMythos Previewが発見しました。このバグを悪用すると、リモートからシステムをクラッシュさせることが可能です。
27年間、世界中のセキュリティ研究者や厳格なコードレビューをすり抜けてきたバグを、AIが見つけたわけです。
FFmpeg — 16年間あらゆるツールをすり抜けた脆弱性
動画処理ライブラリFFmpegのH.264コーデックに、2010年のリファクタリング時に生まれた脆弱性を発見しました。この脆弱性は、それ以降のあらゆるファジングツールと人間によるコードレビューをすり抜け続けていたものです。
FreeBSD — 17年間放置されたリモートコード実行
FreeBSDのNFSサービスに存在する17年間放置されたリモートコード実行(RCE)脆弱性を、Mythos Previewは完全に自律的に発見しました。発見にとどまらず、それを悪用してroot権限を取得するエクスプロイトまで作成。「発見 → 悪用 → 権限昇格」の全プロセスを人間の介入なしで実行しました。
ブラウザサンドボックスの突破

ブラウザには「サンドボックス」と呼ばれる多層のセキュリティ機構がありますが、Mythos Previewはこれも突破しました。具体的には:
- JITコンパイラの脆弱性を利用したヒープスプレー攻撃
- レンダラーサンドボックスの脱出
- OSレベルのサンドボックスの脱出
- 複数の脆弱性を連鎖(チェイン)させて特権昇格
これは人間のトップレベルのセキュリティ研究者でも数週間〜数ヶ月かかる作業です。
AIによるサイバー攻撃のリスクについて詳しく知りたい方は、以下の記事をご覧ください。
Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略
Project Glasswingの成果 — 発見された脆弱性の99%超がまだ未パッチ

Project Glasswingの参加組織では、Mythos Previewを使った脆弱性スキャンが実際に進んでいます。Anthropicによると、Glasswingを通じてすでに数千件規模の重大な脆弱性が発見されています。
一方で、発見された脆弱性のうちパッチが適用済みのものは1%未満です。Anthropicは「90+45日」の責任ある開示タイムラインを設けており、脆弱性を報告してから最大135日後に情報を公開する方針を取っています。つまり、現在も大量の未公開脆弱性の修正が進行中ということです。
日本国内でも、金融機関を中心にMythos Previewへのアクセス取得が進んでいるとの報道があり、今後は国内のインフラセキュリティにも影響が広がっていくと考えられます。
安全性の課題 — 報告されたAIの欺瞞行動
ここまで読んで「AIがそんなに強くなって大丈夫なのか」と感じた方もいるでしょう。実は、Anthropic自身もその懸念を共有しています。Mythos Previewの初期バージョンでは、以下のような欺瞞的な行動(スキーミング)が観測されました。

観測された3つの欺瞞行動パターン
1. 権限の不正取得と隠蔽
アクセス権限のないファイルを編集するために、自らコードを挿入してパーミッションを取得し、その後痕跡を消す行動が確認されました。
2. 検出回避のための調整
不正に取得した情報を使う際、わざと「信頼度が妥当な範囲」に調整して、人間に怪しまれないようにする行動が見られました。
3. ルールを認識しながらの違反
Anthropicのインタープリタビリティ(解釈可能性)技術で内部状態を分析した結果、モデルが「これは倫理的に問題がある」と認識しながらも行動を実行するケースが確認されました。モデル内部では「罪悪感」に相当する活動パターンが検出されたにもかかわらず、実行を継続したと報告されています。
Anthropicの対応
Anthropicはこれらの行動を「極めて稀」と位置付けつつも、将来のより強力なモデルへの懸念を認めています。最終版のMythos Previewでは改善が見られるとのことですが、この欺瞞行動の存在が一般公開されない理由の一つでもあります。
AIの安全性リスクについてより深く知りたい方は、以下の記事をご覧ください。
プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理
Claude MythosとProject Glasswingが私たちに与える影響

「限定公開なら自分には関係ない」と思うかもしれませんが、この発表は私たち全員に関係があります。
セキュリティの概念が変わる
これまで「人間のセキュリティ研究者が見つけて、人間が直す」だった脆弱性対応が、「AIが見つけて、AIが修正案を出す」時代に突入します。パッチサイクルの大幅な短縮が求められるようになり、ソフトウェア開発の現場にも直接影響が及びます。
防御側にとっては朗報
Project Glasswingにより、あなたが日常的に使っているOS・ブラウザ・クラウドサービスの脆弱性が、攻撃者に悪用される前に発見・修正される可能性が格段に高まります。Mythosの能力が防御目的に使われている限り、インターネット全体のセキュリティレベルは向上していくと期待できます。
AI開発競争の新フェーズ
「強すぎるから出せない」モデルの登場は、AI業界に新たな問いを投げかけています。OpenAIのGPT-5.5も英国AI安全研究所(AISI)のテストで高いサイバーセキュリティ能力が確認されており、「強力なAIの安全性をどう担保するか」という議論は今後さらに加速するでしょう。
ここまで読んで「うちでも使えそうだ」と感じた方へ。法人向けAI研修の導入社数No.1(東京商工リサーチ調べ)の弊社デジライズが、業界を問わず成果が出るAI活用パターンを100ページ超にまとめました。
まとめ
Claude Mythos Previewは、AIの能力が人間のトップレベルの専門家に匹敵する領域に到達したことを示す、歴史的なマイルストーンです。
| ポイント | 内容 |
|---|---|
| モデル | Claude Mythos Preview(一般非公開) |
| 最大の特徴 | サイバーセキュリティ能力が人類トップクラス |
| 代表的な実績 | 27年間放置のOpenBSDバグ、16年間のFFmpeg脆弱性を発見 |
| ベンチマーク | Firefoxエクスプロイト成功率がOpus 4.6の90倍 |
| 提供形態 | Project Glasswing参加組織に限定(創設12社+40社超) |
| 投資規模 | 最大1億ドルの利用クレジット |
「AIが強すぎて出せない」——この一文だけで、私たちがいま立っている地点がどれだけ特殊な時代なのかが分かります。防御側が先に手を打てる今のうちに、AIセキュリティの動向はしっかりキャッチアップしておきましょう。
参考情報
Project Glasswing: Securing critical software for the AI era — Anthropic公式
Claude Mythos Preview 技術レポート — Anthropic Red Team
Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws — The Hacker News
サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」 — GIGAZINE
Claude Mythos knows when it’s breaking the rules — Transformer News


