2つのサイバーAI、2つの運命:OpenAIがGPT-5.5-Cyberをリリースする一方、AnthropicのMythosは沈黙
OpenAIは6月22日、最も寛容な攻撃型セキュリティモデルをリリース。本当の見どころはAnthropicの撤回されたMythosとの対比です。
OpenAIが過去最も鋭いサイバーモデルをリリース
2026年6月22日、OpenAIは最も高性能な攻撃型セキュリティモデルを限定プレビューから完全リリースへと移行させ、同社のサイバーセキュリティ施策「Daybreak」の下で2つの新プログラムと併せて提供しました。このモデル、GPT-5.5-Cyberは、脆弱性の発見、エクスプロイトの生成、レッドチーミングに特化してチューニングされたバリアントです——これらは、同社の汎用モデルが意図的に拒否するよう設計されている作業です。
SiliconANGLEによると、このリリースは3つのものとセットで提供されました。GPT-5.5-Cyberモデル本体、「Patch the Planet」と呼ばれるオープンソースのパッチ適用の取り組み、そしてセキュリティベンダーが自社製品にこのモデルを組み込めるようにする「Daybreak Cyber Partner Program」です。最も寛容なバリアントへのアクセスは、引き続きOpenAIの「Trusted Access for Cyber」審査フレームワークの背後でゲート管理されています——ログインしてエクスプロイトを書くよう頼めば済む、というものではありません。
これがじっくり見る価値があるのは、モデルだけが理由ではありません。タイミングです。その10日前、競合のほぼ同等の能力を持つものがオフラインを余儀なくされていました。この2つの結末の対比こそが、今週で最も示唆に富むAIガバナンスの物語なのです。
実際に何が新しいのか
目玉となる変化は、能力と配布の組み合わせです。heise onlineとSiliconANGLEによれば、GPT-5.5-Cyberは通常デュアルユースのサイバー要求でつまずく安全装置の摩擦の一部を取り除きましたが、それは本人確認と信頼性チェックをクリアしたアカウントに限られます。このモデルは、脆弱性を見つけ、その文脈を精査し、「パッチサイクルを開始する」——修正を開発し、サンドボックス環境でテストし、人間によるレビューに向けて準備する——ことができると説明されています。
その最後の一節が重要です。Trail of BitsやHackerOneなどのパートナーと運営される「Patch the Planet」は、研究者が広く使われているオープンソースプロジェクトのメンテナーと直接連携できるよう資金を提供します。SiliconANGLEは、30を超えるプロジェクトが参加していると報じ、cURL、Go、Python、Sigstore、pyca/cryptographyを挙げています。重要なのは、OpenAIが、人間のセキュリティエンジニアがすべての発見をメンテナーに届く前にレビューすると述べている点です——ボランティアのオープンソースチームを機械生成のバグレポートで埋め尽くせば、益よりも害をもたらしかねないという認識の表れです。
パートナープログラムは、エンタープライズセキュリティの著名企業が勢揃いした様相です。SiliconANGLEはAccenture、Cisco、CrowdStrike、IBM、Okta、Palo Alto Networks、Wizを挙げ、heiseとDecryptはCloudflareやSophosといった名前も含むおよそ28〜30社の顔ぶれを示しています。正確なリストは媒体によって異なり、それ自体が、これほど新しいローンチに関する初期報道がまだ落ち着いていないことを思い出させてくれる有用な点です。
誰もが引用する数字
見出しを賑わせている数字は、CyberGymスコア85.6%であり、標準のGPT-5.5の81.8%から上昇したものです。heiseとSiliconANGLEはこの2つの数字を同一に報じているため、この内部的な伸び——サイバー特化モデルが汎用版の兄弟分を上回ったこと——は確かなものに見えます。
CyberGymは複数の情報源で、AIエージェントが大規模なコードベースの中から既知の脆弱性を特定しなければならないベンチマークとして説明されています。heiseは、これが発見をテストするものであって、パッチ適用ではないと指摘しています。つまり、額面通りに受け取っても、85.6%はこのモデルがバグを見つけることに長けていることを示すのであって、必ずしも安全に修正することに長けているわけではありません——パッチサイクルのマーケティングが曖昧にしがちな区別です。
Anthropicの現在は退けられたMythosモデルとの比較は、より不確かであり、明確に指摘しておく価値があります。DecryptはMythos 5のCyberGymスコアを83.8%とし、heiseは83.1%と報じ、それ以前の業界報道ではさらに別の数字も飛び交いました。2ポイント未満の差で、しかも各媒体が合意すらできないものは、意味のある順位付けではありません。Decrypt自身も、「どんなベンチマークでも2ポイント未満の差は、通常であれば取るに足らないものだ」と述べています。「OpenAIのモデルがサイバーで最高だ」というのは、確立された事実ではなくマーケティング上の主張として扱うべきです。
本当の物語:2つのモデル、2つの運命
このローンチを通常のモデル更新と本当に区別しているものは、ここにあります。OpenAIもAnthropicも、本格的な攻撃型サイバー能力を備えたフロンティアモデルを構築しました。両社とも、審査を通過した防御者にアクセスを限定しようとしました。そして、両者は正反対の場所にたどり着いたのです。
Decryptによれば、AnthropicのMythosモデルは6月12日、トランプ政権が国家安全保障上の懸念を挙げて緊急の輸出規制指令を発したのを受けてオフラインにされました。対照的に、OpenAIのGPT-5.5-Cyberはリリースされました——そしてDecryptはその理由を直接報じています。OpenAIは「ローンチ前に、Center for AI Standards and InnovationやOffice of the National Cyber Directorを含む連邦機関と展開前テストを実施した」のです。言い換えれば、OpenAIは扉を開いた後ではなく、開く前に政府と自らのアプローチについて了解を取り付けたように見えます。
これは、製品リリースの装いをまとったガバナンスの教訓です。2つのモデルの能力差は、引用されているあらゆるベンチマークで言えば、無視できる程度のものです。しかし結末の差は甚大です。一方の企業はCrowdStrikeやCiscoをパートナーとして迎え入れている一方で、もう一方のモデルは沈黙したままなのです。決め手となった変数はモデルの品質ではありませんでした——プロセス、順序、そして誰に最初に話を通したか、でした。
誇大宣伝と現実
防御側が勝利したと宣言する前に、いくつか注意点を挙げておきます。第一に、アクセスがゲート管理されているからといって、デュアルユースの問題が消えるわけではありません。脆弱性を確実に発見し武器化できるモデルは、それが有用であるのとちょうど同じ割合で危険です。安全性の論理は、審査フレームワークが持ちこたえることに完全に依存しており、「Trusted Access」はその最も脆弱な認証済みアカウントの強度しか持ちません。ここで挙げた情報源のいずれも、そのゲートを独立して監査してはいません。
第二に、ベンチマークが証明するものは、発表が示唆するほどには多くありません。管理された環境で既知のバグを見つけることは、稼働中の雑然としたネットワークを防御することとは——あるいは大規模に安全にパッチを出荷することとは——同じではありません。Patch the Planetにおける人間レビューの要件は、その自動化が無人で動かすほどには信頼されていないことの暗黙の認めです。
第三に、「禁止されたモデルを打ち負かす」という競争的な枠組みは、レトリック上の役割を果たしています。Mythosがオフラインで、スコア差もノイズの範囲内である中、OpenAIは主要なライバルが排除された競争で王冠を主張できるのです。Decryptはまた、現時点で報道が一方的であることも指摘しています——OpenAIのリリースを批判する政府や専門家の直接のコメントは見つからなかったのです。公的な異議がないことは、健康診断で問題なしと太鼓判を押されたことと同じではありません。
まとめ
実質的なニュースは本物です。OpenAIは、審査を通過した一群の防御者に対して、真に高性能な攻撃型セキュリティモデルを出荷し、併せて、著名で本格的なパートナーを名を連ねた信頼できるオープンソースのパッチ適用プログラムを提供しました。85.6%というCyberGymの数字と81.8%のベースラインは、信頼できる報道全体で一貫しています。一方、Mythosとの比較はそうではなく、懐疑的に読むべきです。
しかし、長く残る教訓はベンチマークについてのものではありません。2つのラボがほぼ同じ危険な能力を構築し、ローンチ前に規制当局と関わった方は事業を続けており、そうしなかった方はオフラインになっています。フロンティアAIの最も繊細な領域では、モデルの品質ではなくガバナンスのプロセスこそが、出荷できるかどうかを決めるものになりつつあります。これは注視に値する変化です。なぜなら、それは最高のモデルを作るラボと同じくらい、ワシントンを巧みに渡り歩くラボを報いるからです。
