
Anthropic은 미국 정부 지침에 따라 회사가 모든 사용자에 대해 모델을 중단하도록 강요한 지 몇 주 후 내일부터 Claude Fable 5에 대한 전체 액세스를 복원합니다. 정부 명령은 6월 12일에 내려졌으며 Anthropic은 외국인이 Fable 5와 더 유능한 Mythos 5 모델을 사용하는 것을 차단해야 했습니다. 이 규칙은 즉시 발효되었고 Anthropic은 사용자의 국적을 실시간으로 확인할 방법이 없었기 때문에 회사는 위반 위험을 감수하기 위해 두 모델을 모두 정지했습니다.
셧다운을 촉발한 원인
이러한 제한은 Fable 5가 보호 장치가 차단하도록 설계된 소프트웨어 취약성을 식별하도록 유도하는 방법을 찾은 Amazon 연구원의 보고서에 따른 것입니다. 한 예로, 모델은 결함이 어떻게 악용될 수 있는지 보여주는 코드를 생성했습니다.
Anthropic은 나중에 Opus 4.8 및 경쟁 모델을 포함하여 성능이 떨어지는 여러 모델이 유사한 결과를 생성할 수 있음을 확인했으며 이는 우회가 Fable 5의 고유한 기능에 달려 있지 않음을 시사합니다.
반품 조건 및 새로운 보호 장치
Fable 5는 7월 1일부터 Claude Platform, Claude.ai, Claude Code 및 Claude Cowork 사용자에게 전 세계적으로 제공될 예정입니다. Pro, Max, Team 및 일부 Enterprise 요금제에는 7월 7일까지 주간 사용 한도의 최대 절반에 해당하는 모델이 포함되며, 그 이후에는 크레딧을 통해 사용량이 차감됩니다. AWS, Google Cloud 및 Microsoft Foundry에 대한 액세스가 이어집니다.
Mythos 5는 제한된 승인된 미국 조직에 대해 이미 반환되었으며 Anthropic은 6월 26일에 해당 액세스를 확장하기 위한 추가 정부 승인을 받았다고 밝혔습니다. 이 회사는 99% 이상의 사례에서 플래그가 지정된 기술을 차단하는 새로운 안전 분류기를 구축했으며 앞으로 AI 탈옥의 심각도를 평가하기 위한 공유 산업 표준에 대해 Amazon, Microsoft 및 Google과 협력하고 있다고 밝혔습니다.
관련 정보는 아래 링크에서 확인하세요