● 앤스로픽 “1600만 건 이상 대화 빼돌려”
23일(현지 시간) 앤스로픽은 딥시크와 문샷AI, 미니맥스 등 중국 기업 3곳이 자사 AI 모델인 클로드의 기능을 불법적으로 추출해간 사실을 확인했다고 자사 홈페이지를 통해 밝혔다. 앤스로픽에 따르면 세 곳의 회사는 가짜 계정 2만4000개를 동원해 1600만 건 이상의 대화 결과물을 빼돌렸다. 딥시크가 15만 건, 문샷AI는 340만 건, 미니맥스는 1300만 건의 대화를 통해 결과물을 빼내갔다고 앤스로픽은 설명했다.
앤스로픽은 중국 회사들이 고성능 AI 모델의 답변을 학습 재료로 삼는 이른바 ‘증류(Distillation)’ 기법을 활용한 것으로 추정했다. 증류는 기업이 자사 상위 모델 성능에 버금가는 경량 모델을 만들 때 쓰는 기법이다. 예를 들어 구글이 자사 AI의 상위 모델인 ‘제미나이 프로’의 답변을 학습시켜 ‘제미나이 플래시’를 만드는 식이다. 상위 모델에 버금가는 능력을 갖춘 경량 하위 모델을 만들 수 있어 미국의 AI 기업들도 종종 활용한다.
문제는 중국 기업들이 경쟁사의 결과물을 추출해갔냐는 점이다. 정보기술(IT) 업계에서 경쟁사의 유료 모델을 상대로 증류 기법을 대규모로 무단 활용하는 것은 사실상의 ‘기술 도용’으로 받아들여진다. 앞서 오픈AI도 12일 미국 하원 중국특별위원회에 제출한 메모에서 ‘딥시크 등 중국 기업이 증류 기법을 활용해 미국 AI 모델의 결과물을 추출해가고 있다’는 우려를 전한 바 있다.
●“中, 수출 금지된 엔비디아 칩도 밀반입”
이 같은 불법적인 ‘증류’가 지식재산권 침해를 넘어 국가 안보 위협으로 이어질 수 있다는 우려도 나온다. 기존 클로드에는 무기 개발이나 악의적 사이버 활동을 막기 위한 ‘안전장치’ 가 설정되어 있으나 불법 추출 모델에서는 안전장치가 무력화될 수 있기 때문이다. 앤스로픽은 애초 국가안보를 이유로 중국 내 클로드 접속을 막았으나, 중국 기업들이 우회접속 했다고 덧붙였다.
여기에 딥시크가 대(對)중국 수출이 금지된 엔비디아의 최첨단 칩을 쓰고 있다는 보도로 반도체 수출 통제 논란도 함께 불거지고 있다. 23일(현지 시간) 로이터통신은 딥시크가 다음 주중 출시 예정인 AI 모델이 엔비디아의 최신 AI 칩 ‘블랙웰’로 훈련됐다고 보도했다. 딥시크가 미국의 AI 칩을 사용한 흔적인 기술적 지표 등을 발표 전에 제거할 것이란 관측도 덧붙였다. 또 딥시크가 밀반입한 블랙웰 칩을 활용해 미국 AI 모델을 ‘증류’했을 것으로 추정했다.
전혜진 기자 sunrise@donga.com