두 사이버 AI, 엇갈린 운명: OpenAI는 GPT-5.5-Cyber를 출시하고 Anthropic의 Mythos는 잠들다

OpenAI가 6월 22일 가장 개방적인 공격 보안 모델을 출시했습니다. 진짜 이야기는 출시가 막힌 Anthropic Mythos와의 대비에 있습니다.

policy2026-06-25 22:00 KST·편집장·5 분

OpenAI, 역대 가장 날카로운 사이버 모델을 출시하다

2026년 6월 22일, OpenAI는 자사에서 가장 뛰어난 공격 보안 모델을 제한적 프리뷰에서 정식 출시로 전환하며, 이를 자사의 "Daybreak" 사이버보안 이니셔티브 아래 두 개의 새로운 프로그램과 함께 묶어 내놓았습니다. 그 모델인 GPT-5.5-Cyber는 취약점 발견, 익스플로잇 생성, 레드티밍에 특화되어 튜닝된 변형 모델로, 이는 회사의 범용 모델들이 의도적으로 거부하도록 설계된 작업들입니다.

SiliconANGLE에 따르면, 이번 출시는 세 가지를 한데 묶어 발표되었습니다. 바로 GPT-5.5-Cyber 모델 그 자체, "Patch the Planet"이라는 오픈소스 패치 활동, 그리고 보안 업체들이 이 모델을 자사 제품에 통합할 수 있도록 하는 "Daybreak Cyber Partner Program"입니다. 가장 개방적인 변형 모델에 대한 접근은 OpenAI의 "Trusted Access for Cyber" 검증 프레임워크 뒤에 계속 닫혀 있습니다. 단순히 로그인해서 익스플로잇을 작성해 달라고 요청할 수 있는 것이 아닙니다.

이것을 더 길게 들여다볼 가치가 있게 만드는 것은 모델만이 아닙니다. 바로 타이밍입니다. 열흘 전, 한 경쟁사의 거의 동일한 역량이 강제로 오프라인 조치되었습니다. 이 두 결과 사이의 대비가 이번 주 가장 시사하는 바가 큰 AI 거버넌스 이야기입니다.

실제로 새로운 것은 무엇인가

가장 큰 변화는 역량과 배포가 짝을 이뤘다는 점입니다. heise online과 SiliconANGLE에 따르면, GPT-5.5-Cyber는 이제 통상적으로 이중 용도(dual-use) 사이버 요청에서 걸리던 일부 안전장치의 마찰을 걷어내지만, 이는 오직 신원 및 신뢰 검증을 통과한 계정에만 해당됩니다. 이 모델은 취약점을 발견하고, 그 맥락을 검토한 뒤, "패치 사이클을 개시"할 수 있다고 묘사됩니다. 즉, 수정안을 개발하고, 샌드박스 환경에서 테스트하며, 사람의 검토를 위해 준비하는 것입니다.

그 마지막 대목이 중요합니다. Trail of Bits, HackerOne 등의 파트너와 함께 운영되는 "Patch the Planet"은 연구자들이 널리 사용되는 오픈소스 프로젝트의 메인테이너들과 직접 협업하도록 자금을 지원합니다. SiliconANGLE은 30개 이상의 프로젝트가 합류했다고 보도하며 cURL, Go, Python, Sigstore, pyca/cryptography를 거명합니다. 결정적으로, OpenAI는 모든 발견 사항이 메인테이너에게 전달되기 전에 사람인 보안 엔지니어가 검토한다고 밝혔습니다. 이는 자원봉사로 운영되는 오픈소스 팀에게 기계가 생성한 버그 리포트를 쏟아붓는 것이 득보다 실이 클 수 있다는 점을 인정한 것입니다.

이 파트너 프로그램은 엔터프라이즈 보안 업계의 명사 인명록처럼 읽힙니다. SiliconANGLE은 Accenture, Cisco, CrowdStrike, IBM, Okta, Palo Alto Networks, Wiz를 나열하고, heise와 Decrypt는 Cloudflare와 Sophos 같은 이름까지 포함하는 약 28~30개 기업 명단을 인용합니다. 정확한 명단은 매체마다 다른데, 이는 그 자체로 이렇게 따끈따끈한 출시에 대한 초기 보도가 아직 정리 중이라는 점을 일깨워 주는 유용한 신호입니다.

모두가 인용하는 그 숫자

헤드라인을 이끄는 수치는 CyberGym 점수 85.6%로, 표준 GPT-5.5의 81.8%에서 상승한 값입니다. heise와 SiliconANGLE 모두 이 두 숫자를 동일하게 보도하므로, 그 내부적 도약 — 사이버 튜닝 모델이 범용 형제 모델을 능가한 것 — 은 탄탄해 보입니다.

CyberGym은 여러 소스에서 AI 에이전트가 대규모 코드베이스 안에서 알려진 취약점을 찾아내야 하는 벤치마크로 묘사됩니다. heise는 이것이 패치가 아니라 발견을 테스트한다고 짚습니다. 그러니 액면 그대로 받아들이더라도, 85.6%라는 수치는 모델이 버그를 찾는 데 능하다는 것이지, 반드시 안전하게 고치는 데 능하다는 의미는 아닙니다. 이는 패치 사이클 마케팅이 흐리는 경향이 있는 구분입니다.

Anthropic의 이제는 밀려난 Mythos 모델과의 비교는 더 불안정하며, 분명히 짚고 넘어갈 가치가 있습니다. Decrypt는 Mythos 5를 CyberGym에서 83.8%로 제시하고, heise는 83.1%로 보도하며, 앞선 업계 보도는 또 다른 수치들을 띄우기도 했습니다. 2점도 안 되는 격차를, 여러 매체가 합의조차 하지 못하는 상황이라면 그것은 의미 있는 순위가 아닙니다. Decrypt 자신도 "어떤 벤치마크에서든 2점 미만의 격차는 보통 특별할 것이 없을 것"이라고 짚습니다. "OpenAI의 모델이 사이버 분야 최고"라는 말은 확립된 사실이 아니라 마케팅 주장으로 취급하시기 바랍니다.

진짜 이야기: 두 모델, 두 운명

이번 출시를 일상적인 모델 업데이트와 실제로 갈라놓는 것이 바로 여기 있습니다. OpenAI와 Anthropic 둘 다 진지한 공격 사이버 능력을 갖춘 프런티어 모델을 만들었습니다. 둘 다 검증된 방어자에게만 접근을 제한하려 했습니다. 그런데 둘은 정반대의 자리에 서게 되었습니다.

Decrypt에 따르면, Anthropic의 Mythos 모델들은 트럼프 행정부가 국가안보 우려를 들어 긴급 수출 통제 지침을 발령한 뒤 6월 12일 오프라인 조치되었습니다. 반면 OpenAI의 GPT-5.5-Cyber는 출시되었고, Decrypt는 그 이유를 직접적으로 보도합니다. OpenAI는 "출시 전에 연방 기관들 — Center for AI Standards and Innovation과 Office of the National Cyber Director 포함 — 과 배포 전 테스트를 진행했다"는 것입니다. 다시 말해, OpenAI는 문을 연 뒤가 아니라 열기 전에 자사의 접근 방식을 정부와 사전에 조율한 것으로 보입니다.

이것은 제품 출시로 차려입은 거버넌스 교훈입니다. 두 모델 사이의 역량 격차는, 인용된 모든 벤치마크로 보건대 무시할 만한 수준입니다. 그러나 결과의 격차는 어마어마합니다. 한 회사는 CrowdStrike와 Cisco를 파트너로 영입하고 있는 반면, 다른 회사의 모델은 어둠 속에 잠겨 있습니다. 결정적 변수는 모델 품질이 아니었습니다. 바로 절차, 순서, 그리고 누구와 먼저 이야기했는가였습니다.

과장과 실제

방어자들이 승리했다고 선언하기 전에 몇 가지 주의할 점이 있습니다. 첫째, 접근이 통제된다고 해서 이중 용도 문제가 사라지지는 않습니다. 취약점을 신뢰성 있게 찾아내고 무기화할 수 있는 모델은 그것이 유용한 만큼 정확히 그 비율로 위험합니다. 안전에 관한 이야기는 전적으로 검증 프레임워크가 버텨주는 데 달려 있으며, "Trusted Access"는 그 가장 취약한 검증 계정만큼만 강력합니다. 여기 어떤 소스도 그 관문을 독립적으로 감사하지 않았습니다.

둘째, 벤치마크는 발표가 함의하는 것보다 적게 증명합니다. 통제된 환경에서 알려진 버그를 찾는 것은 살아 있고 엉망진창인 네트워크를 방어하는 것 — 혹은 대규모로 안전하게 패치를 배포하는 것 — 과 같지 않습니다. Patch the Planet의 사람 검토 요건은 그 자동화가 감독 없이 돌아가도록 신뢰받지 못한다는 점을 암묵적으로 인정한 것입니다.

셋째, "금지된 모델을 이긴다"는 식의 경쟁 구도는 수사적 효과를 노리고 있습니다. Mythos가 오프라인이고 점수 격차가 노이즈 범위 안에 있는 상황에서, OpenAI는 주요 경쟁자가 빠져버린 경쟁의 왕좌를 차지하게 됩니다. Decrypt는 또한 현재로서는 보도가 한쪽으로 치우쳐 있다고 짚습니다. OpenAI의 출시를 비판하는 정부나 전문가의 직접적인 논평을 찾지 못했다는 것입니다. 공개적 반대의 부재가 깨끗한 건강 증명서와 같은 것은 아닙니다.

정리

실질적인 뉴스는 진짜입니다. OpenAI는 검증된 방어자 집단에게 진정으로 유능한 공격 보안 모델을 출시했고, 이름이 명시된 진지한 파트너들과 함께 신뢰할 만한 오픈소스 패치 프로그램을 곁들였습니다. 85.6% CyberGym 수치와 81.8% 기준선은 평판 있는 보도들 전반에서 일관됩니다. 그러나 Mythos 비교는 그렇지 않으며, 회의적으로 읽어야 합니다.

하지만 오래 남을 교훈은 벤치마크에 관한 것이 아닙니다. 두 연구소가 거의 같은 위험한 역량을 만들었는데, 출시 전에 규제 당국과 소통한 쪽은 사업을 하고 있고 그러지 않은 쪽은 오프라인 상태입니다. 프런티어 AI의 가장 민감한 영역에서, 출시 여부를 결정하는 것은 모델 품질이 아니라 거버넌스 절차가 되어가고 있습니다. 이는 지켜볼 가치가 있는 변화인데, 왜냐하면 이것이 모델을 가장 잘 만드는 연구소만큼이나 워싱턴을 가장 잘 헤쳐 나가는 연구소에게 보상을 주기 때문입니다.

#openai#cybersecurity#ai-policy#gpt-5-5

1차 출처

OpenAI expands Daybreak with Patch the Planet and full GPT-5.5-Cyber release (SiliconANGLE)GPT-5.5-Cyber beats Mythos: Update for OpenAI's security model (heise online)OpenAI's GPT-5.5 Cyber AI Beats Anthropic's Banned Mythos Model—And Nobody's Shutting It Down (Decrypt)Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber (OpenAI)