チャエン

株式会社デジライズ 代表取締役

チャエン

OpenAIから次世代モデル群「GPT-5.6」のプレビューが発表されました(米国時間2026年6月26日)。

最近はAnthropicの動きばかりが目立っていて、本丸のChatGPTがしばらく沈黙しているように見えていましたが、ここで一気に押し返してきた格好です。事前公開された資料では、一部のサイバー評価(ExploitBench)で Anthropic の Claude Mythos Preview と競争力のあるスコアを出しながら、出力トークンは約3分の1に抑えていることや、ターミナル操作系の Terminal-Bench 2.1 で SOTA を更新したことが示されています。単一モデルではなく Sol(太陽)・Terra(地球)・Luna(月) という3階層シリーズで出してきた点も特徴です。

ただ、興奮ばかりもしていられません。GPT-5.6は現在、ChatGPTからは利用できず、OpenAI が「小規模な信頼パートナー」と呼ぶ事業者向けに API と Codex 経由でのみ限定プレビューされています。Axios などの報道では、その対象は米政府承認の約20社規模とされています。OpenAI は「数週間以内に広範な提供を目指す」としていますが、正式な一般提供日は未発表です(OpenAI Help Center)。最強AIが国家安全保障の文脈で扱われ始めている——というのが、私の今回の受け取り方です。この記事では、GPT-5.6の中身と限定提供の背景、そして日本企業がいま打てる手までを整理します。


法人向けAI研修の導入社数No.1*の弊社デジライズが、生成AIの基礎知識から社内導入の6ステップ・定着のポイントまでを1冊にまとめた「はじめての生成AI社内導入ガイド」を無料で配布中です。

※出典:株式会社東京商工リサーチ「法人向けリスキリングサービスに関する調査」(2026年5月/調査期間:2026年3月26日〜4月17日/調査方法:デスクリサーチおよびヒアリング/2026年3月末時点)

GPT-5.6とは——Sol・Terra・Lunaの3階層シリーズ

GPT-5.6とは——Sol・Terra・Lunaの3階層シリーズ

GPT-5.6は単一のモデルではなく、用途に応じて使い分ける3階層のラインアップです。公式画像は太陽・地球・月をモチーフにしたデザインで、名前と見た目のつくり込みも含めて、「シリーズ」として打ち出してきた意図がはっきり伝わってきます。

モデル位置づけ特徴
Sol(太陽)フラッグシップ複雑なコーディング・科学的推論・長期タスクに特化。Sol で利用できる新機能 ultra modemax reasoning effort を搭載
Terra(地球)バランス型性能とコストのバランス重視。日常の業務処理の主力
Luna(月)高速・低コスト最速・最安。高ボリュームのテキスト処理向け

イメージとしては、Claudeの「Haiku / Sonnet / Opus」の3階層構造に近い設計です。「1つで全部やる」のではなく、「重い推論はSol、コスト意識のある業務はTerra、ルーティンはLuna」と用途別に割り当てる前提のラインナップになっています。

Sol については、ターミナル操作系の Terminal-Bench 2.1 で SOTA(State Of The Art)を更新したことが OpenAI 公式ブログで明示されています。私が面白いと感じたのは、フラッグシップが値上げではなく価格据え置きで性能が上がっている点と、Sol だけに専用機能(後述)が積まれている点です。3階層のうち上下端にメリハリを付けて、真ん中のTerraを業務用途の主戦場にしてくる狙いが見えます。

Sol で利用できる新機能——ultra modeとmax reasoning effort

Sol で利用できる新機能——ultra modeとmax reasoning effort

Solで注目したいのが、Sol で利用できる ultra modemax reasoning effort という2つの新機能です。Terra・Lunaにはありません。

ultra mode は、1つのエージェントが順番に処理するのではなく、複数のサブエージェントを並走させて1つのタスクを分担処理する仕組みです。単一のコンテキストに収まりきらない長時間・大規模な作業——複数ファイルにまたがるコード改修、マルチステップの調査・集計など——を、エージェントの群れで分けて進めます。私自身もClaude CodeやChatGPTで複数タスクを並行で走らせる設計を日常的に組んでいますが、それがモデル側で標準機能化されたイメージです。

max reasoning effort は、推論に割く計算リソースを最大化するモードです。これまでも reasoning effort のパラメータはありましたが、その上限を引き上げた水準で、難しい数理問題や複雑な論理タスクに対して精度を高めにいく設定です。

Sol 自体の強みとして OpenAI が押し出しているのは、コーディング・サイバーセキュリティ・科学領域です。サイバー評価の ExploitBench では、Anthropic の Claude Mythos Preview と競争力のあるスコアを、出力トークン約3分の1で達成したと公式が説明しています。「全面的にMythos超え」ではなく、「サイバー領域の特定指標でMythos Preview級の性能を、より効率的に出している」という整理が正確です。Terminal-Bench 2.1 の SOTA 更新と合わせて、「重い領域こそ Sol で取りに行く」という設計思想がはっきり読み取れます。

価格——最高峰は据え置き、中下位は値下げ

価格——最高峰は据え置き、中下位は値下げ

価格設計も今回の見どころです。OpenAIが公開した料金は次のとおりです(1Mトークンあたり、USD)。

モデル入力出力
GPT-5.6 Sol$5$30
GPT-5.6 Terra$2.50$15
GPT-5.6 Luna$1$6

ポイントは、最高峰のSolは前世代フラッグシップから価格据え置きのまま性能が上がっていること、そして Terra・Lunaは中下位として明確に値下げレンジに入っていることです。「高い方は値上げせず、下を安くする」というのは、API利用を業務に組み込んでいる事業者にはありがたい方針です。

加えてOpenAIは、2026年7月から Cerebras 上で Sol を提供し、最大毎秒750トークンの高速推論を実現する予定と発表しています。リアルタイム応答が求められるエンタープライズ用途や、ultra modeで複数エージェントを並走させたいケースでは、この高速化が体感性能を大きく押し上げる要素になります。

安全性——過去最大級の安全スタックが必要だった理由

安全性——過去最大級の安全スタックが必要だった理由

GPT-5.6は、性能だけでなく安全性スタックも過去最大級に積まれているモデルです。

OpenAIは事前公開資料で、自動レッドチーム(モデル自身を使って攻撃手法を網羅探索する手法)に膨大な計算リソースを投入してジェイルブレイク経路を洗い出したと説明しています。サイバー攻撃支援・生物リスク・化学リスクといった高リスク領域については、自己評価の結果もあわせて公開されています。

ここで重要なのは、「安全性スタックの厚さ」と「限定パートナー向け運用」がセットだということです。能力が高いほど悪用された場合の被害も大きくなるため、Anthropic が Project Glasswing で Mythos クラスを限定提供してきたのと同じ発想で、OpenAI も最強モデルを段階的に公開する仕組みに移行してきている、と私は受け取っています。

なぜ限定パートナーから提供開始なのか——大統領令と「自主的枠組み」

なぜ限定パートナーから提供開始なのか——大統領令と「自主的枠組み」

GPT-5.6が現在、限定パートナー向けにしか提供されていない直接の背景は、2026年6月2日に署名された AI イノベーションと安全保障に関する米大統領令の影響です。この大統領令は、フロンティアモデルを「covered frontier model」として分類し、政府による事前アクセスや信頼パートナー選定の自主的な枠組みを整備するものとされています。強制的なライセンス制度や義務的な事前許可制度ではないという点はホワイトハウスの公式文書でも明記されており、ここは押さえておきたいポイントです。

OpenAI公式は提供先を「小規模な信頼パートナー」と表現しています。Axios の報道では、これが米政府の承認した約20社規模だと伝えられています(OpenAI公式は具体数を明示していません)。いずれも CodexやAPI 経由でフロンティアモデルを使い込んできた実績のある事業者です。

OpenAI Help Center は「広範な提供は数週間以内を目指す」とした上で、正式な一般提供日は未発表としています。さらに、ChatGPT 経由での提供は現時点ではなく、API と Codex に限られることも明記されています。OpenAI 側の本音としては、できるだけ早く広く提供したいはずですが、最先端モデルでは政府との調整が無視できない段階に入ったことは、今回の動きから読み取れます。

Mythos 5の停止と「最先端AIの国家管理化」タイムライン

Mythos 5の停止と「最先端AIの国家管理化」タイムライン

GPT-5.6の限定プレビューをどう読むかを考えるうえで欠かせないのが、ここ数か月の Anthropic 側の動きです。直近のタイムラインを整理します。

  • 2026年4月7日:Anthropic が Project Glasswing と Claude Mythos Preview を発表。サイバー領域で人間チームの能力を超える脆弱性発見が可能とされ、Glasswing 経由で重要インフラ組織にのみ提供
  • 2026年6月9日:Anthropic が Mythos クラスを安全設計で一般公開した Claude Fable 5 と、Glasswing 限定の Claude Mythos 5 をリリース
  • 2026年6月12日前後:米政府の指示を受け、Anthropic は Fable 5 と Mythos 5 の提供を全顧客向けに無効化(Anthropic 公式声明)
  • 2026年6月27日:報道によれば、米商務省の書簡により Mythos 5 が米国の重要インフラ事業者向けに限定的に再提供されることが認められた(Axios・WIRED 報道)

つまり Anthropic 側はすでに、最強モデルが米政府の許可した枠の中でしか動かない領域に踏み込んでいます。そして 2026年6月26日 に発表された GPT-5.6 が限定パートナー向けプレビューでスタートしたことで、OpenAI・Anthropic 双方の最高峰モデルが、国家安全保障の文脈で運用される段階に入ってきた——これは筆者である私の見立てですが、ここ数ヶ月の動きを並べて見ると、その方向に進んでいるのは確かだと感じています。

Claude Fable 5 と Mythos 5 の経緯について詳しくは、以下の記事もあわせてご覧ください。

Claude Fable 5とは?Mythos級が初めて一般公開|性能・料金・実際に使った所感まで

Claude Fable 5とは?Mythos級が初めて一般公開|性能・料金・実際に使った所感まで

日本企業がいま打てる手——オープンウェイトの確保と複線化

日本企業がいま打てる手——オープンウェイトの確保と複線化

GPT-5.6 の登場と限定パートナー運用は、日本企業にとっても他人事ではありません。これは筆者の見立てになりますが、今後最先端モデルが日本からは自由に使えなくなる可能性は、現実的なリスクとして織り込んでおく時期に入っています。

そのうえで、いま打てる手としては次の3つです。

  • オープンウェイトモデルの確保:自前で重みを保持できるオープンモデル(LLaMA系・国産モデル等)を実運用に組み込んでおく。米国モデルが止まっても業務が止まらない構成を作る
  • モデルの複線化:Claude・ChatGPT・Gemini のいずれか1本に依存しない設計にする。同じ業務フローを複数モデルで切り替え可能にしておくことで、地政学的リスクに耐える
  • 用途別の最適化:すべての業務に最高峰モデルを使う必要はない。Terra・Lunaクラスや国産モデルで十分な業務は意図的にそちらへ寄せ、Sol のような最高峰枠は本当に必要な領域だけに使う

法人として「最新AIで何ができるか」を追いかけるフェーズから、「どのAIが止まっても業務が止まらない構成」を考えるフェーズに入ってきた、というのが今回のGPT-5.6プレビューから読み取れる、本質的なメッセージだと思います。

まとめ

まとめ

GPT-5.6 速報の要点をまとめます。

  • 発表日:2026年6月26日(米国時間)
  • 構成:Sol(フラッグシップ)/ Terra(バランス)/ Luna(高速・低コスト)の3階層シリーズ
  • 新機能:Sol で利用できる ultra mode(サブエージェント並走)と max reasoning effort
  • ベンチマーク:Terminal-Bench 2.1 で SOTA 更新。ExploitBench は Claude Mythos Preview と競争力のあるスコアを、出力トークン約3分の1で達成
  • 価格:Sol 入力$5/出力$30、Terra $2.50/$15、Luna $1/$6(1Mトークンあたり)
  • 高速化:2026年7月より Cerebras 経由で最大毎秒750トークンの提供予定
  • 提供形態:OpenAI 公式表現では「小規模な信頼パートナー」、Axios 報道では約20社規模。API と Codex 経由のみ・ChatGPT では未提供。広範な提供は数週間以内を目指すが、正式な一般提供日は未発表
  • 背景:2026年6月2日の米大統領令により、フロンティアモデルへの政府事前アクセス・信頼パートナー選定の自主的な枠組みが整備済み(強制ライセンス制ではない)
  • Anthropic 側:Mythos 5 と Fable 5 は米政府の指示で6月12日に停止 → 報道では6月27日に Mythos 5 が米国の重要インフラ向けに限定再提供
  • 日本企業の打ち手:オープンウェイトモデル確保/モデル複線化/用途別の最適化

これは筆者の見立てですが、最先端AIは「使える」時代から「使わせてもらえる」時代に少しずつ移っているように感じます。一般提供開始までの数週間、提供条件や利用枠の続報を引き続き追いかけていきます。


法人向けAI研修の導入社数No.1*の弊社デジライズが提供する「法人リスキリング」の研修内容・支援の流れ・料金をまとめたサービス資料を無料でお送りしています。

※出典:株式会社東京商工リサーチ「法人向けリスキリングサービスに関する調査」(2026年5月/調査期間:2026年3月26日〜4月17日/調査方法:デスクリサーチおよびヒアリング/2026年3月末時点)

この記事の著者 / 編集者

チャエン

株式会社デジライズ 代表取締役

チャエン

法⼈向けのAI研修、及び企業向けChatGPTを開発する株式会社デジライズをはじめ、他数社の代表取締役。一般社団法人生成AI活用普及協会評議員を務めながら、GMO AI & Web3株式会社など他数社の顧問も兼任。NewsPicksプロピッカーも兼任。Twitterはフォロワー16万⼈。⽇本初AIツール検索サイト「AI Database」やAIとの英会話ができる「AI英会話」など複数のAIサービスも開発。ABEMAやTBSテレビなどメディア出演も多数。