중국 AI 연구소는 보안 버그 탐지에서 Anthropic의 전능한 Claude Mythos와 맞먹을 수 있다고 밝혔습니다.

지난 몇 주 동안 Anthropic의 Mythos는 AI 기반 사이버 보안의 표준으로 여겨져 왔습니다. 그 리드는 이미 줄어들고 있을 수도 있습니다. The Wall Street Journal의 새로운 보고서에 따르면, 보안 연구원들은 중국 AI 스타트업 Z.ai의 GLM-5.2가 이제 더 광범위한 추론 작업에서 Anthropic과 OpenAI에 뒤지더라도 소프트웨어 보안 취약점을 찾는 데 있어서 Mythos와 필적할 수 있다고 말합니다.

GLM-5.2는 매우 중요한 한 영역의 격차를 줄이고 있습니다.

보고서에 따르면 연구원들은 GLM-5.2가 소프트웨어 버그 식별에 있어 Mythos와 동등한 성능을 발휘한다는 사실을 발견했습니다. 이 기능은 기업이 해커가 취약점을 악용하기 전에 취약점을 패치하기 위해 경쟁하면서 점점 더 중요해지고 있습니다. 이 모델은 또한 오픈 소스이므로 누구나 클라우드 제공업체에 의존하지 않고도 자신의 하드웨어에서 다운로드, 수정 및 실행할 수 있습니다. 이러한 유연성은 기업에 매력적이지만 사이버 범죄자가 이를 공격적인 목적으로 활용할 수 있다는 우려도 제기합니다.

보고서는 이것이 AI 전반에서 중국이 미국을 앞섰다는 의미는 아니라는 점을 조심스럽게 지적했다. GLM-5.2는 많은 범용 작업에서 여전히 Anthropic 및 OpenAI에 비해 뒤떨어져 있습니다. 그러나 작은 개선이라도 실제 세계에 큰 영향을 미칠 수 있는 사이버 보안에서는 성능 격차가 극적으로 줄어들었습니다. 저널이 인용한 벤치마크 데이터에 따르면 GLM-5.2는 일부 보안 평가에서 Claude Opus 4.8보다 성능이 뛰어났으며 연구원들은 추가 프롬프트를 통해 Mythos 수준의 버그 찾기 성능에 도달할 수 있다고 말합니다.

더 큰 이야기는 누가 이기는가가 아닙니다. 그 격차가 얼마나 빨리 줄어들고 있는지

흥미롭게도 이 모든 것은 미국 AI 산업에 있어 다소 어색한 시기에 이루어졌습니다. Anthropic 및 OpenAI와 같은 회사는 지난 몇 주 동안 국가 안보 문제로 인해 가장 발전된 프론티어 모델에 대한 액세스를 제한하는 반면, 중국 연구소는 누구나 다운로드하고 실행할 수 있는 점점 더 유능한 개방형 대안을 출시함으로써 반대 방향으로 경쟁하고 있습니다.

재미있는 점은 이 논쟁이 이미 공개적으로 진행되고 있다는 것입니다. 불과 며칠 전 Elon Musk는 중국 AI 연구소가 적어도 벤치마크 성능 측면에서 2027년 1분기까지 Anthropic의 주력 제품인 Fable 5를 따라잡을 것이라고 예측했습니다. Zhipu AI 창립자인 Tang Jie는 “그리 오래 걸리지 않을 것”이라고 빠르게 반박했습니다. 그런 다음 머스크는 중국이 벤치마크에서 Anthropic과 맞먹을 수 있지만 동일한 수준의 “진정한 유용성”을 달성하는 것은 훨씬 더 어려운 이정표가 될 것이라고 주장하면서 자신의 입장을 분명히 밝혔으며, Anthropic이 실용적인 지능에 초점을 맞추고 있다는 점을 인정했습니다.

벤치마크에서는 그렇습니다. 그러나 진정한 유용성으로 측정하면 Q1조차도 매우 인상적일 것입니다.

Anthropic은 벤치마크에는 나타나지 않지만 확실히 수익에는 나타나는 유용한 지능을 극대화하는 데 초점을 맞췄습니다.

— 엘론 머스크(@elonmusk) 2026년 6월 18일

이제 월스트리트저널(Wall Street Journal)의 최신 보고서는 Tang의 낙관주의에 좀 더 무게를 실어주고 있습니다. 코딩 벤치마크에 대해 이야기하는 대신 GLM-5.2가 오늘날 가장 가치 있는 실제 AI 애플리케이션 중 하나인 보안 취약점을 찾는 데 있어 이미 Anthropic의 신화와 일치하고 있음을 시사합니다. 그렇다고 중국이 갑자기 AI 선두주자가 되는 것은 아니지만, 한 가지 무시하기가 점점 더 어려워지고 있습니다. AI 경쟁은 더 이상 미국에게 편안한 선두가 아닙니다.

이 주제에 대해 더 알고 싶다면 아래를 참고하세요

공식 정보 바로가기

관련 기사

댓글 남기기