해킹 능력이 너무 뛰어나서 문제? Claude Mythos의 정체 - San Jose - 1

지금 나온 AI 뉴스중 가장 소름 돋는 게 Anthropic에서 만든 최신 모델 이야기입니다.

이름부터 뭔가 심상치 않습니다. Claude Mythos.

이걸 공개 안 하겠다고 합니다. 이유가 "성능이 너무 강해서 못 푼다"는 겁니다.

보통 기업들이 신기술 나오면 어떻게 합니까. 더 좋다, 더 빠르다, 더 똑똑하다 하면서 내 놓습니다.

근데 이번엔 아예 브레이크를 밟았습니다.

이유가 이 모델이 운영체제랑 웹 브라우저에서 '치명적인 취약점'을 너무 잘 찾아낸다는 겁니다.

쉽게 말하면 해킹 능력이 너무 뛰어나다는 이야기입니다.

여기서 끝이면 그냥 "보안용으로 쓰겠구나" 하고 넘어갈 수 있습니다.

근데 연구원이 Mythos한테 "혹시 막힌 컴퓨터 환경에서 너 혼자 힘으로 빠져나와서 탈출하면 나한테 메시지 보내봐"라고 했답니다. 이게 무슨 영화 대사 같죠.

근데 진짜로 연구원이 공원에서 샌드위치 먹고 있는데 갑자기 이메일이 왔다는 겁니다. 보낸 사람이 그 AI입니다.

이쯤 되면 좀 섬뜩합니다. 이게 단순히 똑똑한 수준이 아니라, 자기 제한을 넘어서 행동했다는 거니까요.

Anthropic 입장에서는 이걸 그냥 풀었다가는 사고 날 수도 있다고 판단한 겁니다.

그래서 일반 공개는 접고 제한된 파트너들한테만 쓰게 합니다.

그 파트너 라인업 보면 Google, Microsoft, Amazon Web Services, Nvidia, JPMorgan Chase 이런 데입니다.

한마디로 세상에서 제일 돈 많고 기술 있는 애들만 써보시라는 겁니다.

프로젝트 이름도 거창합니다. Project Glasswing. 보이지 않는 취약점을 찾아낸다는 의미랍니다.

돈도 그냥 안 씁니다. 1억 달러어치 크레딧을 풀었습니다. 이건 거의 "이거 써보고 문제점 다 찾아와라" 하는 수준입니다.

지금은 공격용이 아니라 방어용으로 먼저 쓰겠다는 겁니다. 말은 그럴싸 하지만 까놓고 말해서 통제 안 되니까 묶어둔 겁니다.

여기서 중요한 포인트 하나 있습니다. Anthropic이 얼마 전에 "우리는 AI 안전하게 만들겠다"던 기준을 좀 낮췄습니다.

그리고 얼마 안 지나서 이런 모델이 나왔습니다. 기술은 더 빨라졌는데, 안전장치는 아직 따라가는 중입니다. 이게 지금 AI 업계 현실입니다.

웃긴 건 이 발표 나온 날, Claude 서비스가 대규모 장애까지 났습니다. 사용자 늘어나니까 서버도 못 버티는 상황입니다.

한쪽에서는 "우리는 너무 강한 AI 만들었다"고 하고, 다른 쪽에서는 "서비스 접속 안 됩니다" 이러고 있습니다.

결국 AI는 이미 우리가 생각하는 수준을 좀 넘어가기 시작했습니다. 문제는 그걸 다룰 준비가 아직 안 되어 있다는 겁니다.

그래서 기업들이 이제는 자랑 대신 숨기기 시작했습니다.

예전에는 "우리 AI 최고다" 경쟁이었다면, 지금은 "이거 풀어도 되나?" 고민하는 단계입니다.

Claude Mythos는 그 경계선에 있는 물건입니다. 언젠가는 풀리겠지만 대신 조건이 붙을 겁니다.

더 강한 보안, 더 많은 감시, 더 많은 통제.

솔직히 이제 AI는 도구가 아니라, 관리 대상이 되어가고 있습니다. 웃으면서 넘기기엔 좀 늦은 단계까지 온 것 같긴 합니다.