チャエン

株式会社DigiRise 代表取締役

チャエン

OpenAIは2025年12月11日(現地時間)、プロフェッショナルな知識労働と長時間稼働する自律型エージェントに最適化された最新フロンティアモデルシリーズ「GPT-5.2」を発表しました。前モデルからの飛躍的な進化により、特定の実務タスクにおいてついに人間の専門家を匹敵〜凌駕する性能を達成しており、ビジネス現場でのAI活用基準を一気に引き上げる歴史的なアップデートとなりそうです。

この発表の最重要ポイント

  • 人間超えの実務能力: 新指標「GDPval」において、GPT-5.2 Thinkingは44の専門職種タスクで70.9%の確率で人間の専門家に勝利または引き分けを記録しました。
  • コーディング性能がSOTA更新: 実践的なソフトウェアエンジニアリング評価「SWE-Bench Pro」で55.6%を記録し、特にフロントエンドや複雑なUI構築能力が劇的に向上しています。
  • 3つのモデル展開: 用途に合わせて「Instant(高速)」「Thinking(思考)」「Pro(最高性能)」の3モデルが提供され、APIでは新たな推論強度「xhigh」が利用可能です。
  • 即日利用開始: ChatGPTの有料プラン(Plus, Pro, Enterprise等)ユーザー向けに、本日から順次ロールアウトが開始されます。

現時点で判明していること

1. ユーザーへの具体的なメリット

今回発表されたGPT-5.2シリーズは、今まで通り3つのモデルで構成されています。

特徴GPT-5.2 InstantGPT-5.2 ThinkingGPT-5.2 Pro
役割日常使い深考するプロ難問解決のエキスパート
主な強み・高速レスポンス
・親しみやすい会話トーン
・情報を簡潔に提示
人間超えの実務遂行力
・コーディング / 長文解析
・構造的なアウトプット
・シリーズ最高の信頼性
・複雑な数学 / 理論
・重大なミスが少ない
最適な用途・情報検索 / 翻訳
・手順の確認 (How-to)
・日常的なライティング
スプレッドシート作成
アプリ開発 / デバッグ
・契約書の分析・要約
・研究開発 (R&D)
・複雑な数理モデル構築
・間違えられない場面
APIモデル名gpt-5.2-chat-latestgpt-5.2gpt-5.2-pro
API価格
(100万トークンあたり)
入力: $1.75
出力: $14.00
入力: $1.75
出力: $14.00
入力: $21.00
出力: $168.00

また、安全性も大幅に強化されており、自殺・自傷の示唆やメンタルヘルスに関する応答の質が向上し、ユーザーの感情的な依存を防ぐ設計がなされています。

2. 「人間専門家レベル」の実務能力と圧倒的コスパ

OpenAIは今回、GDP(国内総生産)に寄与する主要9産業・44職種の実務タスク(営業資料作成、会計シート、シフト管理など)でモデルを評価する「GDPval」というベンチマークを公開しました。

  • 対人間勝率: GPT-5.2 Thinkingは、業界のプロフェッショナルと比較して70.9%のケースで同等以上の成果物を作成しました(GPT-5は38.8%)。
  • 圧倒的な生産性: 専門家と比較して、速度は11倍以上速く、コストは100分の1以下(<1%)で済むと試算されています。
  • 金融モデリング: 投資銀行のアナリストが行うような複雑なスプレッドシート作成タスクにおいても、スコアが大幅に向上しています。

3. エージェント機能の進化:コーディングと長文理解

開発者やデータサイエンティストにとって、今回のアップデートは「使えるAI」への大きな一歩です。

コーディング能力の飛躍

「SWE-Bench Pro(4言語対応の実務的な評価)」において、GPT-5.2 Thinkingは55.6%という最高スコア(SOTA)を記録しました。

特にフロントエンド開発や、3D要素を含む複雑なUIの実装において強みを発揮します。バグ修正やリファクタリングを、かなりの部分を自律的にこなすことができるようになっています。

超長文コンテキストの完全理解

256kトークン(約26万トークン)に及ぶ長文の中から特定の情報を探し出すテスト(MRCRv2)において、GPT-5.2 Thinkingはほぼ100%の精度を達成しました。

これにより、数百ページの契約書や複数の研究論文を読み込ませた上での、横断的な分析や要約の信頼性が劇的に向上します。

4. 料金体系と提供形態

ChatGPT Plusなどのサブスクリプションユーザーは、追加料金なしでこの新モデルが利用できます。

ChatGPTでの利用

  • 対象: Plus, Pro, Go, Business, Enterpriseプランのユーザー。
  • 開始時期: 本日より順次ロールアウト。
  • 注意点: GPT-5.1は「レガシーモデル」として3ヶ月間併存した後、終了する予定です。

APIの価格(100万トークンあたり)

APIでは性能向上に伴いGPT-5.1より単価が上がっていますが、トークン効率が良いため、タスク完了までの総コストは下がる可能性があります。

モデル名InputCached InputOutput
gpt-5.2 (Thinking)$1.75$0.175$14.00
gpt-5.2-pro$21.00$168.00
gpt-5.1$1.25$0.125$10.00

実際に使ってみた!GPT-5.2 vs 5.1 徹底比較レビュー

実際に事業計画書をPowerPointとExcelで出力

まずは、ChatGPT 5.2 Proに事業計画書を72分かけて作らせてみました。以下にPowerPointとExcelの画像を添付いたします。

PowerPoint
Excel

5.2 Thinkingだと25分かかりましたが、パワポ生成をすることが可能でした。エクセルの作り込みや関数精度は素晴らしいが、資料クオリティはまだこれからという印象です。

Claude 4.5 Opusでは5分かからずパワポの出力が可能でクオリティも高いため、エクセルとパワポ生成においてはGPT-5.2 <<<< Claude 4.5 Opusといえます。

さらにClaudeはskills機能で自身の会社にあったパワポのテンプレも記憶も可能なので、資料作成という点においてはやはりClaudeに軍配が上がります。

ChatGPTの本領は「圧倒的な検索力」と「大量資料の分析」なのでこれらの業務で使うのがおすすめです。

GPT-5.2 vs 5.1 比較

今回のアップデートで「実務能力」がどれほど向上したのか、実際にGensparkのAIチャット上でChatGPTのモデル(GPT-5.2 vs GPT-5.1 Thinking)を切り替え、同一プロンプトでの出力比較を行いました。

結論から言うと、「構造化能力」と「読みやすさ(UX)」において、5.2は進化を遂げています。

1. 短い説明タスク:UXとしての「読みやすさ」で圧勝

用語解説などの短いテキスト生成において、GPT-5.2は明確に優秀でした。

ChatGPT 5.1 Thinkingの出力(一部)

ChatGPT 5.2の出力(一部)

  • GPT-5.1: 内容は正確ですが、強調や段落構成がフラットで、全体的にのっぺりとした印象。
  • GPT-5.2: キーワードを自動で太字にしたり、小見出し的な構造を自ら採用。「どこがポイントか」が一目で分かるレイアウトで出力されました。

💡 ポイント

5.2は「読ませるテキスト」を生成する能力が高く、そのまま記事や資料に転用しやすいと言えます。

2. SaaSの月次PLモデル作成:複雑な仮定の整理

「SaaSの月次PL(損益計算書)モデルを作って」という、仮定と論理的整合性が求められるタスクでの比較です。

ChatGPT 5.1の出力(一部)

ChatGPT 5.2の出力(一部)

  • GPT-5.1: モデルとしては成立していますが、仮定が読みづらく、どの根拠に基づいて数字が出ているのかがわかりづらかった。
  • GPT-5.2: こちらがベストな回答でした。「収益モデル」「初月売上」「月次成長率」「営業利益の定義」などが階層構造でクリアに整理されていました。ただ、予測モデルの正確性に、明確な差は出ませんでした。

💡 ポイント

やはり、情報の構造化に長けており、見やすい出力をしてくれます。資料作成などに使いやすくなるのではないかと思いました。

3. 要約タスク:精度の差はなく「好み」の問題

公式記事の要約など、すでにAIが得意とする領域では、両者に大きな精度の差は見られませんでした。

ChatGPT 5.1の出力(一部)

ChatGPT 5.2の出力(一部)

  • GPT-5.1: 章立てが多く、情報を厚めに盛った「フル版まとめ」。深掘りしたい人向け。
  • GPT-5.2: 本当に主要なポイントに絞った「ダイジェスト版」。記事冒頭やSNS向け。

💡 ポイント

要約のような成熟したタスク領域では、すでに両者とも天井に近い性能です。「情報量の多さ」か「コンパクトさ」か、用途に合わせて使い分けるのが良さそうです。

公式発表へのリンク

今なら、100ページ以上にのぼる企業のための生成AI活用ガイドを配布中!基礎から活用、具体的な企業の失敗事例から成功事例まで、1冊で全網羅しています!

この記事の著者 / 編集者

チャエン

株式会社DigiRise 代表取締役

チャエン

法⼈向けのAI研修、及び企業向けChatGPTを開発する株式会社デジライズをはじめ、他数社の代表取締役。一般社団法人生成AI活用普及協会評議員を務めながら、GMO AI & Web3株式会社など他数社の顧問も兼任。NewsPicksプロピッカーも兼任。Twitterはフォロワー16万⼈。⽇本初AIツール検索サイト「AI Database」やAIとの英会話ができる「AI英会話」など複数のAIサービスも開発。ABEMAやTBSテレビなどメディア出演も多数。