젠슨 황 엔디비아 CEO가 16일(현지 시간) 미국 새너제이에서 열린 엔비디아 GTC 2026 삼성전자 부스를 방문해 기념촬영 하고 있다. 왼쪽부터 황상준 삼성전자 메모리개발담당 부사장, 황 CEO, 한진만 삼성전자 파운드리 사업부장 사장. 제품은 왼쪽부터 삼성전자 HBM4 코어다이 웨이퍼와 그록(Groq) LPU 파운드리 4나노 웨이퍼. 각 웨이퍼에는 ‘AMAZING HBM4’와 ‘Groq Super FAST’라는 젠슨 황 CEO의 친필 서명이 적혀 있다. 사진 제공삼성전자
황 CEO는 이날 기조연설을 통해 ‘그록3 LPU’를 올 하반기 출시할 AI가속기 베라 루빈에 통합한다고 밝혔다. 그록은 추론용 AI 반도체 설계 스타트업이다. 엔비디아의 미래 경쟁자로 떠올랐지만 지난해 엔비디아가 200억 달러(약 29조 원)를 들여 일부 기술과 인력을 영입하는 방식으로 인수한 바 있다.
기존 엔비디아의 AI가속기는 연산을 맡는 그래픽처리장치(GPU)와 기억을 담당하는 고대역폭메모리(HBM)가 분리돼 있어 데이터가 이 사이를 오갈 때 병목 현상이 발생한다. 반면 그록이 만드는 LPU는 연산 회로와 메모리를 처음부터 하나의 실리콘 기판에 새기는 ‘온칩’ 설계가 특징이다. 이를 통해 데이터 병목 현상을 최소화할 수 있다. 그록은 대형언어모델(LLM)을 구동하는 데 있어 LPU가 GPU보다 10배 빠르고 전력도 적게 소모한다고 주장한 바 있다.
엔비디아가 베라 루빈과 그록3 LPU를 통합해 운영하려는 이유는 AI의 성능을 좌우하는 요소로 ‘추론’의 중요성이 점점 더 부각되고 있기 때문이다. 추론은 학습을 끝낸 AI가 답변이나 임무 수행 등 실제 서비스를 제공하는 단계로 데이터를 빠르고 저렴하게 처리하는 능력이 핵심이다.
이에 따라 대규모 연산은 GPU에, 신속한 대응을 요하는 AI의 답변은 LPU에가 맡겨 역할을 분담하겠다는 게 엔비디아의 구상이다. 황 CEO는 이러한 역할 분담으로 파라미터(매개변수)가 ‘조’ 단위인 최고급 AI 모델의 처리량을 35배 높이고 추론 능력을 높일 수 있다고 강조했다. 그러면서 “삼성이 우리를 위해 그록3 LPU를 제조하고 있다”며 “지금 가능한 한 최대한 빠르게 생산을 늘리고 있다. 삼성에게 정말 감사드린다”고 언급하기도 했다.
박종민 기자 blick@donga.com