AI 소식2026-03-318 min

Anthropic이 실수로 유출한 Claude Mythos — “역대 가장 강력한” AI

목차 (9)

어떻게 유출됐어요? — 3,000개 미공개 자료가 노출된 경위
Claude Mythos가 뭐예요?
실제 성능, 얼마나 달라요?
왜 스스로 위험하다고 했을까요?
커뮤니티와 시장은 어떻게 반응했어요?
지금 쓸 수 있나요?
이게 AI 업계에 어떤 의미일까요?
FAQ
마무리

2026년 3월 30일 · 트렌드

지난주 AI업계에서 가장 많이 회자된 사건이 있어요. Anthropic이 아직 발표도 안 한 새 모델의 정보를 실수로 외부에 노출해버렸거든요. 미공개 블로그 드래프트가 검색 가능한 공개 서버에 올라가 있었고, Fortune이 이를 발견해 보도했어요. 그게 바로 3월 26일의 일이에요.

유출된 내용에는 모델 이름, 성능 수치, 그리고 내부 경고까지 담겨 있었어요. 모델 이름은 Claude Mythos, 내부 코드명은 Capybara예요. Anthropic은 “훈련이 완료됐고 지금까지 만든 AI 중 가장 강력하다”고 밝혔어요. 그런데 동시에 “전례 없는 사이버보안 위험”이 있다는 말도 직접 했어요.

유출 24시간 안에 소셜미디어는 들끓었어요. 사이버보안 주식이 일제히 떨어졌고, Polymarket에는 예측 시장이 열렸어요. “역대 AI 중 가장 강력”이라는 말이 현실이라면, 뭐가 어떻게 달라질지 정리해봤어요.

빠르게 보기

– Claude Mythos = 코드명 Capybara, Opus보다 위에 있는 새 등급
– 약 3,000개 미공개 자료가 담긴 데이터 캐시가 외부에 노출됨
– 코딩·추론·사이버보안 벤치마크 모두 Opus 4.6 대비 크게 향상
– 사이버 능력 면에서 “현존 AI 중 가장 앞서” — Anthropic 스스로 경고
– 사이버보안 주식 일제히 하락, 비트코인도 동반 하락
– Anthropic, 정부 고위 관계자들에게 사이버 위험 직접 경고 중
– 현재 방어적 사이버보안 연구자 소수 얼리 액세스만 허용

어떻게 유출됐어요? — 3,000개 미공개 자료가 노출된 경위
Claude Mythos가 뭐예요?
실제 성능, 얼마나 달라요?
왜 스스로 위험하다고 했을까요?
커뮤니티와 시장은 어떻게 반응했어요?
지금 쓸 수 있나요?
이게 AI 업계에 어떤 의미일까요?
FAQ
마무리

AI 리뷰만 보시나요? 직접 만드는 이야기도 있어요귀찮은개발자 EP.04 →

어떻게 유출됐어요? — 3,000개 미공개 자료가 노출된 경위

Anthropic의 콘텐츠 관리 시스템(CMS) 설정 오류가 원인이었어요. 미공개 블로그 드래프트들이 외부에서 검색 가능한 데이터 캐시에 저장돼 있었어요. 공개된 건 아니지만, URL을 알면 접근할 수 있는 상태였어요.

이를 발견한 건 보안 연구자 두 명이에요. LayerX Security의 Roy Paz와 케임브리지 대학의 Alexandre Pauwels가 이 노출된 데이터 캐시를 발견했어요. 총 약 3,000개의 미공개 자산이 접근 가능한 상태였어요. Claude Mythos 관련 드래프트도 그 안에 있었어요. Fortune이 Anthropic에 연락했고, 보도가 나간 뒤에야 접근이 차단됐어요.

Anthropic 측은 “인재(human error)”라고 공식 인정했어요. 보안을 최우선으로 내세우는 회사에서 이런 실수가 나왔다는 점이 아이러니하다는 말도 많았어요. 유출 이후 Anthropic은 모델의 존재를 확인하면서 “현재까지 개발한 AI 중 가장 강력하며, 성능의 단계적 도약을 의미한다”고 말했어요.

유출 직후 사이버보안 관련 주식이 일제히 하락했어요. 비트코인과 소프트웨어 주식도 함께 떨어졌어요. 시장은 “이 모델이 나오면 기존 보안 솔루션이 무력화될 수 있다”고 읽었어요.

Claude Mythos가 뭐예요?

내부 코드명은 Capybara예요. 현재 Claude의 최상위 모델인 Opus보다 한 단계 위에 있는 새로운 등급이에요. 유출된 문서에 따르면, Capybara는 Opus 시리즈와는 별개의 모델 계층으로 설계됐어요. 크기도 더 크고, 추론 방식도 다르다고 해요. 일부 분석가들은 Mythos를 사실상 “Opus 5″에 해당하는 모델로 보고 있어요.

Anthropic은 이 모델을 “범용 모델”로 정의했어요. 특정 분야에만 강한 게 아니라, 코딩·추론·사이버보안·과학적 분석 등 여러 영역에서 고르게 성능이 높아요. 유출 문서에는 Capybara를 “역대 가장 강력한 AI”라고 표현한 문구도 포함돼 있었어요.

Opus와 어떻게 다른가요?

현재 Claude의 최상위 모델은 Opus 4.6이에요. Capybara는 이보다 상위 계층으로, 가격도 더 비쌀 거라고 유출 문서는 언급했어요. Anthropic 측도 “비용이 높아 아직 일반 출시에 적합하지 않다”고 직접 밝혔어요. 단순히 성능이 더 높은 게 아니라, 운용 비용 자체가 다른 차원이에요.

실제 성능, 얼마나 달라요?

유출된 문서에 포함된 벤치마크 결과를 보면 차이가 꽤 커요. Opus 4.6 대비 소프트웨어 코딩, 학술 추론, 사이버보안 세 영역 모두에서 크게 높은 점수를 기록했어요. 구체적인 수치는 유출 문서에서 일부만 공개됐지만, “단계적 도약(step change)”이라는 표현을 쓴 이유가 있어 보여요.

영역	Claude Opus 4.6	Claude Mythos (Capybara)
소프트웨어 코딩 (SWE-Bench)	최고 수준	크게 향상 (“드라마틱하게 높은”)
학술 추론 (GPQA Diamond)	최고 수준	현존 공개 모델 중 최고
사이버보안 능력	강력	“현존 AI 중 가장 앞서”
운용 비용	높음	더 높음 (미확정)
일반 공개 시점	사용 가능	얼리 액세스 (일부)

비교 수치가 유출 기반이라 다소 조심스럽게 봐야 해요. 하지만 Anthropic 자신이 “단계적 도약”이라는 표현을 쓴다는 점에서, 일반적인 소폭 개선과는 다른 수준임은 분명해 보여요.

Claude Mythos vs Opus 4.6 성능 비교 (유출 정보 기반) / GoCodeLab

왜 스스로 위험하다고 했을까요?

유출 문서에서 가장 눈에 띄는 부분은 사이버보안 관련 경고예요. Anthropic은 내부적으로 “현재 다른 어떤 AI보다 사이버 능력이 앞서 있다”고 평가했어요. 소프트웨어 취약점을 빠르게 찾아내고 익스플로잇하는 능력이 크게 높아졌다고 해요. 문서는 “현재 방어자의 속도를 훨씬 앞지르는 방식으로 취약점을 악용할 수 있다”는 표현도 썼어요.

그래서 Anthropic은 이 모델을 즉시 일반에 공개하지 않기로 했어요. 대신 첫 얼리 액세스 그룹을 방어적 사이버보안 분야 연구자로 제한했어요. 공격보다 방어에 먼저 도움을 줘서, 모델이 광범위하게 공개될 때까지 “방어자에게 유리한 시간을 주겠다”는 논리예요.

주의
Anthropic의 경고는 Mythos가 위험하다는 게 아니라, 잘못 사용되면 위험해질 수 있다는 뜻이에요. 회사 자체가 위험성을 인지하고 출시 방식을 조정하는 건 오히려 책임 있는 접근이에요. “먼저 경고하는 회사”가 더 믿을 수 있다고 보는 시각도 있어요.

커뮤니티와 시장은 어떻게 반응했어요?

유출 직후 X(트위터)와 Reddit을 중심으로 반응이 폭발했어요. “코딩 몬스터”, “AGI에 한 발짝”, “단계적 도약이 맞다”는 기대감이 압도적이었어요. 특히 Anthropic 스스로 “가장 강력하다”고 쓴 문장이 그대로 퍼지면서 흥분 분위기가 이어졌어요. Claude를 개발에 적극 쓰는 엔지니어와 연구자들 사이에서 기대감이 특히 높았어요.

반면 사이버보안 우려를 표하는 목소리도 뚜렷했어요. “Anthropic 스스로 가장 위험하다고 했다”는 점을 들며 불안감을 드러낸 반응이 많았어요. 실제로 Anthropic은 유출 이후 정부 고위 관계자들에게 이 모델의 사이버보안 위험을 직접 경고하는 브리핑을 진행하고 있는 것으로 알려졌어요. 일부는 “공개도 안 된 모델인데 과장됐다”, “유출 자체가 의도적 마케팅 아닌가”라며 회의적 시각을 유지했어요.

시장 반응은 더 즉각적이었어요. 사이버보안 관련 주식이 일제히 하락했어요. 비트코인과 소프트웨어 주식도 함께 움직였어요. 시장이 “AI가 기존 사이버보안 솔루션을 무력화할 수 있다”는 신호로 읽은 거예요. Polymarket(크립토 기반 예측 시장)에는 “Claude Mythos가 2026년 6월 30일까지 공개될 것인가”라는 마켓이 열렸고, 현재 45% 확률로 거래되고 있어요.

지금 쓸 수 있나요?

현재는 소수의 얼리 액세스 고객만 테스트할 수 있어요. Anthropic은 Claude API를 통해 단계적으로 접근 권한을 늘릴 계획이에요. 첫 단계에서는 방어적 사이버보안에 집중한 연구자와 기업이 대상이고, 이후 단계에서 더 넓은 API 접근이 열릴 예정이에요.

일반 사용자가 Claude.ai에서 쓸 수 있는 시점은 명시되지 않았어요. Anthropic은 출시 일정이 “상업적 계획이 아니라 안전 평가 결과에 달려 있다”고 밝혔어요. 안전 평가를 통과해야 다음 단계로 넘어가는 구조예요.

Bloomberg는 Anthropic이 2026년 10월 IPO를 추진 중이며 기업 가치는 약 3,800억 달러(약 520조 원)로 예상된다고 보도했어요. 공개적으로 “가장 강력한 AI”를 IPO 전후에 론칭하면 기업 가치에 긍정적이니까요. 이런 맥락에서 Mythos 출시가 IPO 타임라인과 맞물릴 거라는 분석도 나와요. 하지만 Anthropic은 출시 일정에 대해 공식 확인을 하지 않고 있어요.

Claude Mythos 예상 출시 흐름 (공식 확인 없음) / GoCodeLab

이게 AI 업계에 어떤 의미일까요?

Mythos 유출이 보여주는 건 크게 두 가지예요. 첫째, AI 모델의 성능 격차가 생각보다 빠르게 벌어지고 있어요. Opus 4.6이 나온 지 얼마 안 됐는데, 이미 그 위에 “단계적 도약”이라는 표현이 붙는 모델이 존재해요. 경쟁사 GPT-5.4나 Gemini 3 Deep Think와 비교하면 AI 성능 경쟁의 속도가 얼마나 빠른지 체감이 돼요.

둘째, AI 회사들이 스스로 안전 우려를 공개하는 사례가 늘고 있어요. 이전엔 위험성을 드러내지 않으려 했다면, 이제는 먼저 말하는 게 신뢰를 얻는 방식이 됐어요. Anthropic이 “방어자 먼저” 원칙을 적용한 것도 이 맥락에서 볼 수 있어요. 사이버보안 분야에서 공격과 방어의 균형이 어떻게 바뀔지가 앞으로 가장 큰 관심사예요.

FAQ

Q. Claude Mythos와 Capybara는 같은 모델인가요?

네, 같은 모델이에요. Capybara는 내부 코드명이고, Mythos는 유출된 드래프트에 나온 공개 명칭이에요. Anthropic이 어떤 이름으로 정식 출시할지는 아직 확정되지 않았어요. 일부는 “Claude Opus 5″가 될 것으로 예상하지만, Anthropic은 네이밍을 공식 발표하지 않았어요.

Q. Opus 4.6을 쓰고 있는데, Mythos가 나오면 바꿔야 하나요?

당장 바꿀 필요는 없어요. Mythos는 성능이 높은 만큼 비용도 더 높을 거예요. 일반적인 작업이라면 Sonnet 4.6이나 Opus 4.6으로도 충분해요. Mythos는 고난이도 코딩, 보안 분석, 복잡한 학술 연구처럼 현재 모델의 한계를 느끼는 경우에 의미 있어요.

Q. 사이버보안 위험이라고 했는데, 써도 안전한가요?

Anthropic이 경고한 건 모델이 악용될 경우의 위험성이에요. 일반 사용자에게 위험하다는 뜻이 아니에요. 오히려 회사 스스로 위험을 인지하고 접근 제한, 단계적 출시, 방어 먼저 원칙을 적용하는 건 안전한 운영을 위한 조치예요. 걱정보다는 지켜보는 게 적절해요.

Q. 언제쯤 일반 사용자도 쓸 수 있어요?

공식 일정은 없어요. Anthropic은 안전 평가 결과에 따라 결정하겠다고만 했어요. 업계 일각에서는 Anthropic의 IPO 일정(예상 2026년 하반기)과 맞물릴 수 있다는 추측이 있지만, 확인된 정보는 아니에요. 지금은 얼리 액세스 단계이고, API 접근이 점진적으로 확대될 거예요.

Q. 이번 유출이 Anthropic에 타격이 될까요?

단기적으로는 이미지 측면에서 아쉬운 부분이 있어요. 보안을 중시하는 회사가 약 3,000개 미공개 자산을 실수로 노출했으니까요. 하지만 모델 자체의 성능이 알려지면서 기대감도 높아졌어요. 사이버보안 주식 하락 반응에서 볼 수 있듯, 업계는 이 모델을 진지하게 받아들이고 있어요. 유출이 없었다면 조용히 준비했을 텐데, 오히려 더 많은 관심을 받게 됐어요.

Q. Anthropic의 안전 평가란 정확히 무엇인가요?

Anthropic은 AI 안전 연구로 유명한 회사예요. 새 모델 출시 전에 “책임 있는 확장 정책(Responsible Scaling Policy)”에 따라 위험성 평가를 해요. 사이버보안, 생물학적 위험, 자율성 같은 영역에서 모델이 기준을 초과하면 출시를 늦춰요. Mythos는 사이버보안 부문에서 이 기준을 건드렸기 때문에 방어 커뮤니티 우선 접근 정책을 쓴 거예요.

마무리

Claude Mythos는 아직 공개된 모델이 아니에요. 유출로 먼저 알려졌고, Anthropic도 존재를 인정했지만 정식 발표는 안 했어요. 성능이 얼마나 다른지는 공식 벤치마크가 나와야 정확히 알 수 있어요. 지금은 유출된 정보를 바탕으로 윤곽만 그릴 수 있어요.

이번 유출에서 중요한 신호 두 가지가 읽혔어요. Anthropic이 “단계적 도약”이라는 표현을 쓴다는 건 단순한 성능 개선이 아니라는 뜻이에요. 그리고 AI 회사가 스스로 위험성을 인정하고 출시 방식을 조정하는 모습은, 이 업계가 조금씩 성숙해가고 있다는 증거이기도 해요.

GPT-5.4나 Gemini 3 Deep Think와 나란히 놓았을 때 어떤 결과가 나올지, 공식 출시 뒤 직접 써보고 다시 얘기할 거예요.

공식 출처

Claude Mythos 공식 출시 소식이 나오면 GoCodeLab에서 가장 먼저 직접 써보고 알려드릴게요.

귀찮은개발자 시리즈

AI 도구 리뷰만 보시나요? 직접 만드는 이야기도 있어요. Claude랑 7일 만에 SaaS를 만든 개발 일지예요.

EP.04: SaaS 하나를 7일 만에 만들었다 →

이 글은 2026년 3월 30일에 작성됐어요. Claude Mythos 관련 정보는 유출된 문서와 Anthropic의 공식 코멘트를 기반으로 작성했어요. 공식 발표 전 정보이므로 실제 스펙과 다를 수 있어요.

X LinkedIn Facebook

← 전체 글 보기