앤스로픽 “딥시크 등 中기업 3곳, 우리 AI 결과물 불법으로 빼가” :SODA

미국 인공지능(AI) 기업 앤스로픽이 자사 AI 모델 ‘클로드’의 기술을 딥시크를 비롯한 중국 기업들이 무단으로 추출해 갔다고 밝혔다. 앞서 챗GPT 개발사 오픈AI가 자사 AI 결과물을 딥시크가 빼내가고 있다고 미국 의회에 밝힌데 이어 앤스로픽도 중국에 문제를 제기한 것.미중 AI 패권 경쟁이 격화되고 있는 가운데 중국 AI 모델들의 ‘베끼기’ 학습 의혹을 두고 양국 간 갈등이 심화되는 양상이다.

● 앤스로픽 “1600만 건 이상 대화 빼돌려”

23일(현지 시간) 앤스로픽은 딥시크와 문샷AI, 미니맥스 등 중국 기업 3곳이 자사 AI 모델인 클로드의 기능을 불법적으로 추출해간 사실을 확인했다고 자사 홈페이지를 통해 밝혔다. 앤스로픽에 따르면 세 곳의 회사는 가짜 계정 2만4000개를 동원해 1600만 건 이상의 대화 결과물을 빼돌렸다. 딥시크가 15만 건, 문샷AI는 340만 건, 미니맥스는 1300만 건의 대화를 통해 결과물을 빼내갔다고 앤스로픽은 설명했다.

앤스로픽은 중국 회사들이 고성능 AI 모델의 답변을 학습 재료로 삼는 이른바 ‘증류(Distillation)’ 기법을 활용한 것으로 추정했다. 증류는 기업이 자사 상위 모델 성능에 버금가는 경량 모델을 만들 때 쓰는 기법이다. 예를 들어 구글이 자사 AI의 상위 모델인 ‘제미나이 프로’의 답변을 학습시켜 ‘제미나이 플래시’를 만드는 식이다. 상위 모델에 버금가는 능력을 갖춘 경량 하위 모델을 만들 수 있어 미국의 AI 기업들도 종종 활용한다.

문제는 중국 기업들이 경쟁사의 결과물을 추출해갔냐는 점이다. 정보기술(IT) 업계에서 경쟁사의 유료 모델을 상대로 증류 기법을 대규모로 무단 활용하는 것은 사실상의 ‘기술 도용’으로 받아들여진다. 앞서 오픈AI도 12일 미국 하원 중국특별위원회에 제출한 메모에서 ‘딥시크 등 중국 기업이 증류 기법을 활용해 미국 AI 모델의 결과물을 추출해가고 있다’는 우려를 전한 바 있다.

앞서 딥시크는 지난해 1월 선보인 오픈소스 추론모델 ‘R1’에 대해 경쟁사 모델의 결과물을 기반으로 학습하지 않았다고 주장했다. 이번 논란에 대해서 중국 기업들은 아직까지 입장을 내놓지 않고 있다.

●“中, 수출 금지된 엔비디아 칩도 밀반입”

이 같은 불법적인 ‘증류’가 지식재산권 침해를 넘어 국가 안보 위협으로 이어질 수 있다는 우려도 나온다. 기존 클로드에는 무기 개발이나 악의적 사이버 활동을 막기 위한 ‘안전장치’ 가 설정되어 있으나 불법 추출 모델에서는 안전장치가 무력화될 수 있기 때문이다. 앤스로픽은 애초 국가안보를 이유로 중국 내 클로드 접속을 막았으나, 중국 기업들이 우회접속 했다고 덧붙였다.

여기에 딥시크가 대(對)중국 수출이 금지된 엔비디아의 최첨단 칩을 쓰고 있다는 보도로 반도체 수출 통제 논란도 함께 불거지고 있다. 23일(현지 시간) 로이터통신은 딥시크가 다음 주중 출시 예정인 AI 모델이 엔비디아의 최신 AI 칩 ‘블랙웰’로 훈련됐다고 보도했다. 딥시크가 미국의 AI 칩을 사용한 흔적인 기술적 지표 등을 발표 전에 제거할 것이란 관측도 덧붙였다. 또 딥시크가 밀반입한 블랙웰 칩을 활용해 미국 AI 모델을 ‘증류’했을 것으로 추정했다.

앤스로픽은 중국 AI 기업들의 불법 증류 의혹을 제기한 데 이어 첨단 AI 칩의 중국 수출을 전면 통제해야 한다고 주장하고 있다. 물리적 칩 접근을 막아야 불법적 증류도 제한할 수 있다는 것이다. 앞서 다리오 아모데이 앤스로픽 최고경영자(CEO)는 도널드 트럼프 대통령의 엔비디아 칩 일부 수출 허용 방침에 대해 “북한에 핵무기를 파는 것과 비슷한 실수”라며 강력히 비판하기도 했다.

전혜진 기자 sunrise@donga.com