[베이징=뉴스핌] 조용성 특파원 = 중국의 AI 기업인 딥시크(DeepSeek)가 지난 1월 출시한 대형 추론 AI 모델인 R1이 전 세계에 충격을 안긴 데 이어 딥시크는 업그레이드 모델인 R2를 조만간 공개할 것으로 전해졌다.
딥시크가 R2 모델을 오는 15일부터 30일 사이에 발표할 것으로 전해졌다고 중국 IT 매체인 콰이커지(快科技)가 13일 보도했다. 딥시크는 이 같은 보도에 대해 정확한 발표 일자는 추후 공지하겠다고만 답했다. 딥시크가 보도에 대해 부인하지 않은 만큼, 시장은 딥시크가 조만간 R2를 발표할 것으로 받아들이고 있다.
딥시크의 R2는 고부하 추론 작업의 성능을 최적화하기 위해 더욱 진보된 혼합 전문가 모델(MoE, Mixture of Experts)을 채택할 것으로 예상된다.
특히 R2는 화웨이(華爲)가 자체 개발한 GPU(그래픽처리장치)인 어센드(성텅, 昇騰) 910B를 기반으로 훈련됐다.
이로써 일부 전문가는 R2의 훈련 비용이 GPT4에 비해 97% 감소할 것으로 예상했다. 이로 인해 딥시크 R2의 사용료는 오픈AI의 유사 제품보다 현저히 낮을 것이며, 이는 기존 AI 서비스의 가격 모델을 뒤엎어 놓을 것이라는 관측이 나오고 있다.
딥시크 R2의 총 매개변수는 1조 2000억 개로 이는 R1의 6710억 개에 비해 두 배 늘어났다.
R2를 훈련한 화웨이의 연구실 측은 화웨이 어센드 910B를 여러 개 묶어서 만든 초고성능 컴퓨터가 사용됐다고 설명했다. 또한 해당 컴퓨터는 512 페타플롭스(PetaFLOPS, 1초에 1경 번 연산)의 연산 성능을 내며, 칩 자원 활용률은 82%에 달했다.
화웨이 측은 "컴퓨터의 성능은 엔비디아 A100 훈련 클러스터의 약 91%에 해당한다"고도 설명했다.
한편 딥시크는 지난 1월 선풍적인 인기를 끌었지만 지금은 이용률 감소 현상을 겪고 있다. 반도체·AI 분야 연구 분석 기관인 세미애널리시스(SemiAnalysis)는 딥시크의 이용률이 연초 최고 7.2%에서 크게 하락해 현재는 3%밖에 안 된다고 밝혔다.
이 같은 하락 배경에는 딥시크의 최신 모델인 R1 모델이 엉뚱한 답변을 내놓거나 먹통이 되는 등의 이유 외에도 차기 버전인 R2 모델 출시가 계속해서 늦어지고 있기 때문이란 분석이 나온다. 딥시크 R2 모델은 당초 지난 5월 출시될 것으로 예상됐었다.

ys1744@newspim.com