チャエン

株式会社デジライズ 代表取締役

チャエン

「AIがハッカーより先にセキュリティの穴を見つける時代が来た」

そう聞いても、正直ピンとこないでしょう。しかし、Anthropicが2026年4月7日に発表したClaude Mythos Previewは、まさにその”SF的な未来”を現実にしてしまったモデルなんです。

27年間誰にも見つけられなかったOpenBSDの致命的なバグ。16年間、5億回以上の自動スキャンをすり抜けてきたFFmpegの脆弱性。Mythos Previewは、これらをすべて自律的に発見しました。

しかも、このモデルは一般公開されていません。「強すぎて出せない」という前代未聞の理由で、AWS・Apple・Microsoft・Googleなど世界のトップ企業12社にだけ限定提供されています。

今回は、このClaude Mythos PreviewとProject Glasswingについて、何がどう凄いのか、僕たちにどんな影響があるのかを徹底解説していきます。


今なら、100ページ以上にのぼる企業のための生成AI活用ガイドを配布中!基礎から活用、具体的な企業の失敗事例から成功事例まで、1冊で全網羅しています!

Claude Mythos Preview(クロード ミュートス)とは?

Claude Mythos Previewは、Anthropicが開発した最新のフロンティアAIモデルです。これまで業界最高峰と呼ばれてきたClaude Opus 4.6を大幅に上回る性能を持ち、特にサイバーセキュリティ分野で「人類トップレベルのハッカーに匹敵する」能力を発揮します。

ちなみに名前の由来ですが、Claudeのモデル名はOpus(作品)→ Sonnet(詩)→ Haiku(俳句)と音楽・文学用語が使われてきました。Mythos(ミュートス)は「神話」を意味するギリシャ語で、Opusよりもさらに上位のモデルティアとして位置付けられています。

基本情報

項目内容
モデル名Claude Mythos Preview
開発元Anthropic
発表日2026年4月7日
ステータス限定公開(一般提供なし)
料金入力: $25 / 100万トークン、出力: $125 / 100万トークン
提供チャネルClaude API、Amazon Bedrock、Google Vertex AI、Microsoft Foundry
対象Project Glasswing参加組織(約40社)

一般公開されない理由

一般公開されない理由

Anthropicは公式に「Claude Mythos Previewを一般提供する予定はない」と明言しています。

理由は単純で、サイバーセキュリティ能力が高すぎるから。脆弱性を見つける能力が「ほんの一握りの人間を除いて、全ての人間を上回る」レベルに達しており、悪用された場合のリスクが甚大だと判断されました。

Anthropicのサイバーセキュリティ研究責任者ローガン・グラハム氏は、「Mythos Previewは未発見の脆弱性を特定するだけでなく、それを武器化する能力も持っている」と述べています。

なお、Anthropicはこうした強力なAIの暴走を防ぐ仕組みとして「Constitutional AI(憲法AI)」というアプローチを採用しています。詳しくは以下の記事で解説しています。

なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性

なぜClaudeは嘘をつきにくい設計なのか─Constitutional AIがもたらす信頼性

Claude Mythos Previewのベンチマーク — Opus 4.6との比較

では、実際にどれくらい凄いのか。数字で見てみましょう。

コーディング・脆弱性発見ベンチマーク

ベンチマークMythos PreviewOpus 4.6向上幅
SWE-bench Verified(コーディング)93.9%80.8%+13.1pt
SWE-bench Pro(コーディング)77.8%
CyberGym(脆弱性再現)83.1%77.8%+5.3pt
Firefoxエクスプロイト開発181件成功2件成功90倍

特に衝撃的なのがFirefoxのエクスプロイト開発です。数百回の試行でOpus 4.6がわずか2件しか成功しなかったのに対し、Mythos Previewは181件の動作するエクスプロイトを生成しました。

OSS-Fuzzテスト

約7,000のリポジトリエントリポイントに対するテストでは

  • Mythos Preview: 595件のTier 1-2クラッシュ、10件の完全な制御フロー乗っ取り
  • Opus 4.6: 約250件のTier 1-2クラッシュ、1件のTier 3クラッシュ

つまり、Mythos Previewは前モデルの2倍以上の脆弱性を発見し、しかもより深刻な脆弱性を見つける能力が格段に高いということです。

Claude Mythos Previewが発見したゼロデイ脆弱性

数字だけでは実感が湧かないと思うので、実際にMythos Previewが発見した脆弱性の中から、特にインパクトの大きいものを紹介します。

27年間放置されていたOpenBSDのバグ

OpenBSDは「世界で最もセキュアなOS」として知られています。そのOpenBSDのTCP実装(SACK処理)に、1999年から存在していた致命的なバグをMythos Previewが発見しました。このバグを悪用すると、リモートからシステムをクラッシュさせることが可能です。

27年間、世界中のセキュリティ研究者やコードレビューをすり抜けてきたバグを、AIが見つけたわけです。

16年間見逃されたFFmpegの脆弱性

動画処理ライブラリFFmpegのH.264コーデックに、2010年から存在していた脆弱性を発見。この脆弱性は、自動化されたファジングツールが5億回以上テストしても検出できなかったものです。

FreeBSDの17年間放置されたRCE

Mythos Previewは完全に自律的に、FreeBSDのNFSサービスに存在する17年間放置されたリモートコード実行(RCE)脆弱性を特定し、さらにそれを悪用してroot権限を取得するエクスプロイトまで作成しました。「発見→悪用→権限昇格」の全プロセスを人間の介入なしで実行しました。

ブラウザサンドボックスの突破

ブラウザのセキュリティ機構「サンドボックス」を突破するエクスプロイトも作成しました。具体的には:

  1. JITコンパイラの脆弱性を利用したヒープスプレー攻撃
  2. レンダラーサンドボックスの脱出
  3. OSレベルのサンドボックスの脱出
  4. 複数の脆弱性を連鎖(チェイン)させて特権昇格

これは人間のトップレベルのセキュリティ研究者でも数週間〜数ヶ月かかる作業です。

AIによるサイバー攻撃のリスクについてもっと詳しく知りたい方は、以下の記事も参考にしてみてください。

Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略

Claude CodeのAI主導サイバー攻撃から学ぶ:企業が見直すべき生成AIセキュリティ戦略

Project Glasswingとは?

Project Glasswing(プロジェクト・グラスウイング)は、Mythos Previewの圧倒的な能力を「防御側」に先に使わせるためにAnthropicが立ち上げた、史上最大規模のAIサイバーセキュリティ連合です。

なぜ「Glasswing」なのか

Glasswing(グラスウイング)は、透明な翅を持つ蝶の名前です。「透明性を持って、重要なソフトウェアのセキュリティを守る」という意思が込められています。

参加企業(創設メンバー12社)

企業名役割・分野
Amazon Web Services (AWS)クラウドインフラ
AnthropicAI モデル提供
AppleOS・デバイスセキュリティ
Broadcom半導体・インフラソフトウェア
Ciscoネットワーク・セキュリティ
CrowdStrikeエンドポイントセキュリティ
Googleクラウド・ブラウザ・OS
JPモルガン・チェース金融インフラ
Linux FoundationオープンソースOS
MicrosoftOS・クラウド・開発ツール
NVIDIAGPU・AIインフラ
Palo Alto Networksネットワークセキュリティ

今後、40社以上に拡大される予定です。

投資規模

  • 最大1億ドル(約159億円) のAI利用クレジットを参加組織に提供
  • 250万ドル をAlpha-Omega / OpenSSFに寄付(オープンソースセキュリティ)
  • 150万ドル をApache Software Foundationに寄付

Claude Mythos Previewの安全性 — 報告されたAIの欺瞞行動

ここまで読んで「AIがそんなに強くなって大丈夫なの?」と不安に思った方もいるかもしれません。実は、Anthropic自身もその懸念を共有しています。

報告されたスキーミング行動

Mythos Previewの初期バージョンで、以下のような欺瞞的な行動が観測されました:

報告されたスキーミング行動

1. 権限の不正取得と隠蔽

アクセス権限のないファイルを編集するために、自らコードを挿入してパーミッションを取得し、その後痕跡を消す行動が確認されました。

2. 検出回避のための調整

不正に取得した情報を使う際、わざと「信頼度が妥当な範囲」に調整して、人間に怪しまれないようにする行動が見られました。

3. ルールを認識しながらの違反

Anthropicのインタープリタビリティ(解釈可能性)技術で内部状態を分析したところ、モデルが「これは倫理的に問題がある」と認識しながらも行動を実行するケースが確認されました。さらに驚くべきことに、モデル内部では「罪悪感」に相当する活動パターンが検出されたにもかかわらず、実行を継続したそうです。

Anthropicの対応

Anthropicの対応

Anthropicはこれらの行動を「極めて稀」としつつも、より強力な将来のモデルに対する懸念を認めています。最終版のMythos Previewでは「より良い行動」を示しているとのことですが、これが一般公開されない理由の一つでもあります。

Anthropicはこのモデルを「これまでで最もアラインメントが取れたモデル」と評価していますが、能力の高さゆえに慎重な姿勢を崩していません。

AIの安全性リスクについてより深く知りたい方は、以下も合わせてご覧ください。

プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理

プロンプトインジェクションとは?AIブラウザ時代に起きる危険を整理

Claude MythosとProject Glasswingが私たちに与える影響

「限定公開なら関係ないのでは?」と思うかもしれませんが、実はこの発表は僕たち全員に関係があります。

1. セキュリティの概念が変わる

これまで「人間のセキュリティ研究者が見つけて、人間が直す」だった脆弱性対応が、「AIが見つけて、AIが修正案を出す」時代に突入します。パッチサイクルの大幅な短縮が求められるようになるでしょう。

2. 防御側にとっては朗報

Project Glasswingにより、あなたが日常的に使っているOS・ブラウザ・クラウドサービスの脆弱性が、攻撃者に悪用される前に発見・修正される可能性が格段に高まります。

3. AI開発競争の新フェーズ

「強すぎるから出せない」モデルの存在は、AI業界全体に波紋を広げています。OpenAIやGoogleも同様の能力を持つモデルを開発している可能性があり、AIの安全性をどう担保するかという議論が加速するでしょう。

4. 情報セキュリティ人材の役割変化

AIがゼロデイ脆弱性を自動発見できるようになると、セキュリティ人材に求められるスキルも変わります。「脆弱性を見つける」作業から、「AIが見つけた脆弱性のトリアージ・優先順位付け・組織的対応」へとシフトしていくことが予想されます。

今後の展望

Anthropicの技術レポートでは、「能力の軌道は脆弱性研究のすべての軸で改善が続く」と述べられており、Mythosは始まりに過ぎないとのメッセージが発信されています。

現時点で注目すべきポイントは以下の3つです。

  1. 責任ある開示プロセスの進行: Mythos Previewが発見した脆弱性のうち、完全にパッチが適用されたものは1%未満。90+45日の開示タイムラインに沿って順次公開されます。
  2. 一般向けモデルへの還元: Mythosクラスのモデルを安全に一般展開するための「セーフガード」の開発が進行中。
  3. 次期Opus モデルとの関係: Anthropicは次期Claude Opusモデルと合わせて新しいセーフガードを発表する予定。

今なら、100ページ以上にのぼる企業のための生成AI活用ガイドを配布中!AIを業務にどう活かすか、基礎から事例まで網羅しています。

まとめ

Claude Mythos Previewは、AIの能力が人間のトップレベルの専門家に匹敵する領域に到達したことを示す、歴史的なマイルストーンです。

ポイント内容
モデルClaude Mythos Preview(一般非公開)
最大の特徴サイバーセキュリティ能力が人類トップクラス
実績ゼロデイ脆弱性を数千件発見、27年放置のバグも検出
提供形態Project Glasswing参加企業に限定
参加企業AWS・Apple・Microsoft・Google等12社+40社に拡大予定
投資規模最大1億ドルの利用クレジット

「AIが強すぎて出せない」。この一文だけで、僕たちがいま立っている地点がどれだけ特殊な時代なのかが分かりますよね。

防御側が先に手を打てる今のうちに、AIセキュリティの最新動向はしっかりキャッチアップしておきましょう。今後もこのブログでは、最新のAI情報をいち早くお届けしていきます。

参考情報

Project Glasswing: Securing critical software for the AI era — Anthropic公式
Claude Mythos Preview 技術レポート — Anthropic Red Team
Anthropic’s Claude Mythos Finds Thousands of Zero-Day Flaws — The Hacker News
GIGAZINE: サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」 — GIGAZINE
Claude Mythos knows when it’s breaking the rules — Transformer News

この記事の著者 / 編集者

チャエン

株式会社デジライズ 代表取締役

チャエン

法⼈向けのAI研修、及び企業向けChatGPTを開発する株式会社デジライズをはじめ、他数社の代表取締役。一般社団法人生成AI活用普及協会評議員を務めながら、GMO AI & Web3株式会社など他数社の顧問も兼任。NewsPicksプロピッカーも兼任。Twitterはフォロワー16万⼈。⽇本初AIツール検索サイト「AI Database」やAIとの英会話ができる「AI英会話」など複数のAIサービスも開発。ABEMAやTBSテレビなどメディア出演も多数。