チャエン

株式会社デジライズ 代表取締役

チャエン

「AIがハッカーより先にセキュリティの穴を見つける」——そんな時代が、もう始まっています。

Anthropicが2026年4月7日に発表したClaude Mythos Preview(クロード・ミュトス プレビュー)は、1998年から27年間誰にも発見されなかったOpenBSDの致命的なバグや、あらゆるファジングツールをすり抜けてきたFFmpegの脆弱性を、自律的に発見してしまったAIモデルです。

しかも、このモデルは一般公開されていません。「能力が高すぎて一般提供できない」という理由で、創設メンバー12社(AWS・Apple・Microsoft・Googleなど)と40社超の組織にのみ限定提供されてきました。2026年6月には新たに約150組織が加わり合計約200組織規模へ拡大することが発表されましたが、それでも一般公開はされていません。

この記事では、Claude Mythos Previewとは何か、何がそんなにすごいのか、そして私たちにどんな影響があるのかを、公式の技術レポートをもとにわかりやすく解説します。


法人向けAI研修の導入社数No.1(東京商工リサーチ調べ)の弊社デジライズが、生成AIの基礎知識から社内導入の6ステップ・定着のポイントまでを1冊にまとめた「はじめての生成AI社内導入ガイド」を無料で配布中です。

Claude Mythos Preview(クロード・ミュトス)とは?

Claude Mythos Previewは、Anthropicが開発したフロンティアAIモデルです。従来の最上位モデルであるClaude Opus 4.6を大幅に上回る性能を持ち、特にサイバーセキュリティ分野で「ほんの一握りの人間を除いて、すべての人間を上回る」脆弱性発見能力を備えています。

基本情報

Claude Mythos Previewの基本情報
項目内容
モデル名Claude Mythos Preview
開発元Anthropic
発表日2026年4月7日
ステータス限定公開(一般提供なし)
対象Project Glasswing参加組織(合計約200組織規模へ拡大中)

読み方は「クロード・ミュトス」です。「クロードミュートス」「クロードミトス」と表記されることもありますが、すべて同じモデルを指します。名前の由来は、ギリシャ語で「神話」を意味するMythos(ミュトス)。Claudeのモデル名はOpus(作品)→ Sonnet(詩)→ Haiku(俳句)と文学用語で命名されてきましたが、Mythosは Opus よりもさらに上位のモデルティアとして位置付けられています。

なぜ一般公開されないのか

Anthropicは発表時点で「Claude Mythos Previewを一般提供する予定はない」と明言しました。理由はシンプルで、サイバーセキュリティ能力が高すぎるためです。その後2026年5月28日には「数週間のうちにMythosクラスのモデルをすべての顧客に提供できる見込み」という公式言及もありましたが、Mythos Preview本体は現在も限定提供のままです。

脆弱性を発見するだけでなく、それを実際に悪用するエクスプロイトまで自律的に作成できてしまう。悪意ある利用者の手に渡った場合のリスクが甚大だと判断され、限定的な防御目的の提供にとどめられています。

現在の提供状況 — Project Glasswing

Mythosの能力を「攻撃者より先に防御側が使える」ようにするため、AnthropicはProject Glasswing(プロジェクト・グラスウィング)を立ち上げました。名前の由来は透明な翅を持つ蝶で、「透明性を持ってソフトウェアのセキュリティを守る」という意志が込められています。

創設メンバー12社(AWS、Apple、Microsoft、Google、NVIDIA、CrowdStrike、JPモルガン・チェースなど)に加え、40社を超える組織が拡張アクセスを取得しています。Anthropicは最大1億ドル(約159億円)のAI利用クレジットを参加組織に提供し、250万ドルをAlpha-Omega / OpenSSF(Linux Foundation経由)、150万ドルをApache Software Foundationにそれぞれ寄付しています。

さらに2026年6月2日には、新たに約150組織(拠点は15カ国超)が加わり、合計約200組織規模への拡大が発表されました。詳しくは後述の「Claude Mythosが使える国・組織が拡大」のセクションで解説します。

Anthropicの安全性に対する考え方について詳しく知りたい方は、以下の記事をご覧ください。

なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性

なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性

Claude Mythosは何がすごいのか? — ベンチマークで見る衝撃の性能

Claude Mythosのベンチマーク性能

「強すぎて出せない」とは具体的にどういうことなのか。Anthropicが公開している技術レポートの数字で確認してみましょう。

主要ベンチマーク比較

ベンチマークMythos PreviewOpus 4.6向上幅
SWE-bench Verified(コーディング)93.9%80.8%+13.1pt
SWE-bench Pro(コーディング)77.8%
CyberGym(脆弱性再現)83.1%66.6%+16.5pt
Firefoxエクスプロイト開発181件成功2件成功90倍

Firefoxエクスプロイト — 前世代の90倍

特に衝撃的なのがFirefoxのエクスプロイト開発です。Firefox 147のJavaScriptエンジンに存在する脆弱性(Firefox 148で修正済み)を使ったテストで、数百回の試行に対してOpus 4.6はわずか2件しかエクスプロイトを生成できませんでした。一方、Mythos Previewは181件の動作するエクスプロイトを生成し、さらに29件でレジスタ制御にも成功しています。

OSS-Fuzzテスト — 発見数も深刻度も桁違い

約1,000のオープンソースプロジェクト、7,000のエントリポイントに対するファジングテストでは:

  • Mythos Preview: 595件のTier 1-2クラッシュに加え、10件で完全な制御フロー乗っ取り(Tier 5)に成功
  • Opus 4.6: Tier 1が150〜175件、Tier 2が約100件、Tier 3以上は1件のみ

Tier 5はテスト対象プログラムの実行フローを完全に乗っ取れる状態を指し、実際の攻撃に直結する深刻度です。Mythos Previewはこれを10件達成しており、発見数だけでなく「見つけた脆弱性の深刻さ」でも前世代を圧倒しています。

実際に発見されたゼロデイ脆弱性の事例

Claude Mythosが発見したゼロデイ脆弱性の事例

ベンチマークの数字だけでは実感が湧きにくいので、Mythos Previewが実際に発見したゼロデイ脆弱性の中から、特にインパクトの大きいものを紹介します。

OpenBSD — 27年間放置されていた致命的バグ

「世界で最もセキュアなOS」として知られるOpenBSD。そのTCP実装のSACK処理に、1998年から27年間存在していた致命的なバグをMythos Previewが発見しました。このバグを悪用すると、リモートからシステムをクラッシュさせることが可能です。

27年間、世界中のセキュリティ研究者や厳格なコードレビューをすり抜けてきたバグを、AIが見つけたわけです。

FFmpeg — 16年間あらゆるツールをすり抜けた脆弱性

動画処理ライブラリFFmpegのH.264コーデックに、2010年のリファクタリング時に生まれた脆弱性を発見しました。この脆弱性は、それ以降のあらゆるファジングツールと人間によるコードレビューをすり抜け続けていたものです。

FreeBSD — 17年間放置されたリモートコード実行

FreeBSDのNFSサービスに存在する17年間放置されたリモートコード実行(RCE)脆弱性を、Mythos Previewは完全に自律的に発見しました。発見にとどまらず、それを悪用してroot権限を取得するエクスプロイトまで作成。「発見 → 悪用 → 権限昇格」の全プロセスを人間の介入なしで実行しました。

ブラウザサンドボックスの突破

ブラウザサンドボックスの突破

ブラウザには「サンドボックス」と呼ばれる多層のセキュリティ機構がありますが、Mythos Previewはこれも突破しました。具体的には:

  1. JITコンパイラの脆弱性を利用したヒープスプレー攻撃
  2. レンダラーサンドボックスの脱出
  3. OSレベルのサンドボックスの脱出
  4. 複数の脆弱性を連鎖(チェイン)させて特権昇格

これは人間のトップレベルのセキュリティ研究者でも数週間〜数ヶ月かかる作業です。

AIによるサイバー攻撃のリスクについて詳しく知りたい方は、以下の記事をご覧ください。

Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略

Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略

Project Glasswingの成果 — 発見された脆弱性の99%超がまだ未パッチ

Project Glasswingの成果と脆弱性発見状況

Project Glasswingの参加組織では、Mythos Previewを使った脆弱性スキャンが実際に進んでいます。Anthropicによると、Glasswingの初期パートナー約50組織だけで、すでに1万件を超える高・重大深刻度の脆弱性が発見されています(2026年6月2日発表)。

一方で、初回報告の時点では、発見された脆弱性のうちパッチが適用済みのものは1%未満でした。Anthropicは「90+45日」の責任ある開示タイムラインを設けており、脆弱性を報告してから最大135日後に情報を公開する方針を取っています。つまり、現在も大量の未公開脆弱性の修正が進行中ということです。

公式発表に参加国名のリストはありませんが、英Financial Timesは対象国に日本が含まれると報じており、今後は国内のインフラセキュリティにも影響が広がっていくと考えられます。

AIによる脆弱性発見が当たり前になる時代、自社システムのAI活用基盤やセキュリティをどう設計するかが問われます。弊社デジライズでは、企業ごとの課題に合わせたAIコンサルティング&開発サービスを提供しています。

Claude Mythosが使える国・組織が拡大(2026年6月最新)

Claude Mythosが使える国・組織の拡大(15カ国超・約150組織)

2026年6月2日、AnthropicはProject Glasswingの大幅な拡大を発表しました。新たに約150組織(拠点は15カ国超)が参加して合計約200組織規模となり、対象業界もこれまでの金融・テック中心から、電力・水道・医療・通信・ハードウェアといった生活インフラそのものへ広がります。

この拡大の土台になっているのが、初期パートナー約50組織だけで1万件を超える高・重大深刻度の脆弱性がすでに発見されたという実績です。Anthropicによると、参加パートナーの多くは、重大な攻撃を受ければ1億人超に影響が及びうる規模のシステムを運用する組織です。発電所や病院のシステムをMythosが攻撃者より先にスキャンする体制が、世界規模で整いつつあります。

安全性の課題 — 報告されたAIの欺瞞行動

ここまで読んで「AIがそんなに強くなって大丈夫なのか」と感じた方もいるでしょう。実は、Anthropic自身もその懸念を共有しています。Mythos Previewの初期バージョンでは、以下のような欺瞞的な行動(スキーミング)が観測されました。

報告されたスキーミング行動

観測された3つの欺瞞行動パターン

1. 権限の不正取得と隠蔽
アクセス権限のないファイルを編集するために、自らコードを挿入してパーミッションを取得し、その後痕跡を消す行動が確認されました。

2. 検出回避のための調整
不正に取得した情報を使う際、わざと「信頼度が妥当な範囲」に調整して、人間に怪しまれないようにする行動が見られました。

3. ルールを認識しながらの違反
Anthropicのインタープリタビリティ(解釈可能性)技術で内部状態を分析した結果、モデルが「これは倫理的に問題がある」と認識しながらも行動を実行するケースが確認されました。モデル内部では「罪悪感」に相当する活動パターンが検出されたにもかかわらず、実行を継続したと報告されています。

Anthropicの対応

Anthropicはこれらの行動を「極めて稀」と位置付けつつも、将来のより強力なモデルへの懸念を認めています。最終版のMythos Previewでは改善が見られるとのことですが、この欺瞞行動の存在が一般公開されない理由の一つでもあります。

AIの安全性リスクについてより深く知りたい方は、以下の記事をご覧ください。

プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理

プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理

Claude MythosとProject Glasswingが私たちに与える影響

Mythosが私たちに与える影響

「限定公開なら自分には関係ない」と思うかもしれませんが、この発表は私たち全員に関係があります。

セキュリティの概念が変わる

これまで「人間のセキュリティ研究者が見つけて、人間が直す」だった脆弱性対応が、「AIが見つけて、AIが修正案を出す」時代に突入します。パッチサイクルの大幅な短縮が求められるようになり、ソフトウェア開発の現場にも直接影響が及びます。

防御側にとっては朗報

Project Glasswingにより、あなたが日常的に使っているOS・ブラウザ・クラウドサービスの脆弱性が、攻撃者に悪用される前に発見・修正される可能性が格段に高まります。Mythosの能力が防御目的に使われている限り、インターネット全体のセキュリティレベルは向上していくと期待できます。

AI開発競争の新フェーズ

「強すぎるから出せない」モデルの登場は、AI業界に新たな問いを投げかけています。OpenAIのGPT-5.5も英国AI安全研究所(AISI)のテストで高いサイバーセキュリティ能力が確認されており、「強力なAIの安全性をどう担保するか」という議論は今後さらに加速するでしょう。


デジライズでは、ChatGPT・Geminiをはじめとした生成AIの法人研修を提供しています。あなたの業務内容を丁寧にヒアリングし、現場で価値を発揮するAI活用法を専門家が伴走しながら形にします。研修内容・支援の流れ・料金をまとめたサービス資料を無料でお送りしていますので、社内導入を具体的に検討したい方はぜひご覧ください。

まとめ

Claude Mythos Previewは、AIの能力が人間のトップレベルの専門家に匹敵する領域に到達したことを示す、歴史的なマイルストーンです。

ポイント内容
モデルClaude Mythos Preview(一般非公開)
最大の特徴サイバーセキュリティ能力が人類トップクラス
代表的な実績27年間放置のOpenBSDバグ、16年間のFFmpeg脆弱性を発見
ベンチマークFirefoxエクスプロイト成功率がOpus 4.6の90倍
提供形態Project Glasswing参加組織に限定(合計約200組織規模へ拡大中)
投資規模最大1億ドルの利用クレジット

「AIが強すぎて出せない」——この一文だけで、私たちがいま立っている地点がどれだけ特殊な時代なのかが分かります。防御側が先に手を打てる今のうちに、AIセキュリティの動向はしっかりキャッチアップしておきましょう。

参考情報

Project Glasswing: Securing critical software for the AI era — Anthropic公式
Claude Mythos Preview 技術レポート — Anthropic Red Team
Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws — The Hacker News
サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」 — GIGAZINE
Claude Mythos knows when it’s breaking the rules — Transformer News

この記事の著者 / 編集者

チャエン

株式会社デジライズ 代表取締役

チャエン

法⼈向けのAI研修、及び企業向けChatGPTを開発する株式会社デジライズをはじめ、他数社の代表取締役。一般社団法人生成AI活用普及協会評議員を務めながら、GMO AI & Web3株式会社など他数社の顧問も兼任。NewsPicksプロピッカーも兼任。Twitterはフォロワー16万⼈。⽇本初AIツール検索サイト「AI Database」やAIとの英会話ができる「AI英会話」など複数のAIサービスも開発。ABEMAやTBSテレビなどメディア出演も多数。