미국 정부가 Anthropic의 가장 강력한 AI 모델에 제동을 걸었습니다.

미국 정부와 Anthropic의 문제는 완화되지 않는 것 같습니다. 회사는 이제 미국 내에서 근무하는 외국인 Anthropic 직원을 포함하여 모든 외국인에 대해 Fable 5 및 Mythos 5에 대한 액세스를 중단하라는 명령을 받았습니다.

Anthropic은 6월 12일에 지침을 받았으며 모든 고객이 준수할 수 있도록 두 모델을 비활성화한다고 말했습니다. 다른 인류 모델은 영향을 받지 않습니다. 정부는 전체 국가 안보 문제를 공개적으로 설명하지 않았지만 Anthropic은 이 명령이 Fable 5의 보호 장치를 우회하거나 탈옥하기 위한 보고된 방법과 연관되어 있음을 이해한다고 밝혔습니다.

펜타곤 싸움 이후 새로운 충돌

이것은 워싱턴과의 Anthropic의 첫 번째 심각한 대립이 아닙니다. 올해 초 회사는 클로드가 완전 자율 무기와 대규모 국내 감시에 사용되는 것을 막는 제한 조치를 해제하는 것을 거부한 뒤 미 국방부와 분쟁에 휘말렸습니다. 그 싸움은 블랙리스트에 오르고 법적 조치를 취해야 한다는 주장으로 이어졌고, Anthropic의 안전 우선 입장은 미국 정부의 일부와 직접적으로 충돌하게 되었습니다.

최신 지침은 Anthropic을 다시 익숙한 위치로 되돌렸습니다. 관계자들은 강력한 AI 시스템에 대한 접근을 우려하고 있는 반면, Anthropic은 자사의 보호 장치가 비현실적인 기준으로 오해되거나 판단되고 있다고 주장합니다.

Fable 5가 관심사가 된 이유

Fable 5에 대한 우려는 Mythos 5의 고급 사이버 보안 기능과 관련이 있습니다. Anthropic은 Mythos급 모델이 소프트웨어 취약점을 발견하고 이용할 수 있다고 밝혔으며, Mythos 5는 더 널리 출시되기 전에 NSA 및 기타 정부 관련 평가자에 의해 테스트된 것으로 알려졌습니다. 이러한 기능은 보안 팀이 약점을 식별하고 수정하는 데 도움이 될 수 있지만 공격적이거나 악의적인 목적으로 사용될 경우 국가 안보 문제를 야기할 수도 있습니다.

Fable 5는 더 엄격한 가드레일을 갖춘 Mythos 5의 공개 버전으로 불과 며칠 전에 출시되었습니다. Anthropic은 민감한 사이버 보안 및 생물학 관련 쿼리를 Opus 4.8로 차단하거나 리디렉션하도록 설계되었다고 말했습니다.

Anthropic은 보고된 우회가 이미 알려진 사소한 취약점만을 표면화했으며 다른 공개 모델도 유사한 작업을 수행할 수 있다고 말했습니다. 그럼에도 불구하고 사이버 보안만큼 민감한 주제에 대해서는 주의가 불합리하지 않습니다. Mythos 5가 높은 수준에서 소프트웨어 취약점을 식별할 수 있다면 그 가드레일만으로는 충분하지 않습니다. 밀폐되어 있어야 합니다. 앤트로픽은 보고된 탈옥 규모가 좁았다고 주장할 수도 있지만, 이번 정부의 우려는 이해하기 쉽다. 이 경우에는 “미안한 것보다 안전한 것이 낫다”는 것이 정부의 가장 방어적인 입장일 수 있습니다.

관련 정보는 아래 링크에서 확인하세요

자세한 정보 확인

관련 기사

댓글 남기기