전 세계 인공지능(AI) 업계에 지각 변동을 일으킨 중국 스타트업 딥시크에 세간의 관심이 집중되면서 창업자에도 이목이 쏠리고 있다.
27일(현지시간) 미국 월스트리트저널(WSJ)과 매사추세츠공대(MIT)의 정보기술매체 테크놀로지 리뷰 등에 따르면, 딥시크 설립자는 중국 광둥성 출신인 1985년생 량원펑이라는 인물이다. 공학 분야에서 특히 손꼽히는 명문대인 저장대에서 컴퓨터 공학을 전공한 것으로 알려졌다.
그는 대학을 졸업하고 몇 년 후인 2015년 대학 친구 2명과 함께 '하이-플라이어'(High-Flyer)라는 헤지펀드를 설립하고 컴퓨터 트레이딩에 딥러닝 기법을 선구적으로 적용해 자금을 모았다. 펀드 자산 규모가 80억달러(약 11조5000억원) 수준으로 늘어났고, 량원펑은 소규모 AI 연구소를 설립해 운영하다 독립적인 회사로 분리해 딥시크를 2023년 5월 창업했다.
량원펑의 펀드 하이-플라이어는 2019년부터 AI 개발을 위한 칩을 비축하기 시작해 거대언어모델(LLM)을 훈련할 수 있는 엔비디아의 그래픽처리장치(GPU) 약 1만개를 확보해 AI 칩 클러스터를 구축했다.
이후 딥시크는 2023년 11월 첫 번째 오픈소스 AI 모델 '딥시크 코더'를 공개했고, 지난해 5월엔 한층 더 발전한 '딥시크-V2'를 출시했다. 이 모델은 강력한 성능과 저렴한 비용을 앞세워 중국 내 AI 모델 시장에 가격 전쟁을 촉발했다. 나아가 차례로 출시한 딥시크-V3과 딥시크-R1은 딥시크의 이름을 세계에 알렸다.
딥시크는 V3와 R1이 모두 미국의 주요 AI 모델보다 성능이 더 낫거나 비슷한 수준이라고 자신했다. 특히 미국 수학경시대회인 AIME 2024 벤치마크 테스트에서 R1은 79.8%를 얻어 오픈AI 'o1'(79.2%)보다 앞섰다고 강조했다.
회사 측은 딥시크-V3 개발에 들인 비용이 557만6000달러(약 78억8000만원)에 불과하다고 밝혔다. 이는 메타가 최신 AI 모델인 라마(Llama)3 모델을 엔비디아의 고가 칩 'H100'으로 훈련한 비용 대비 10분의 1 수준이다.
다만 딥시크가 밝힌 금액은 엔비디아의 저렴한 칩인 'H800 GPU'를 시간당 2달러에 2개월 동안 빌린 비용을 계산했다. 인건비와 운영비 등은 포함되지 않아 전체 비용이라고 할 수는 없다.
오픈AI의 전 임원이었던 잭 카스는 딥시크를 두고 “자원 제약이 종종 창의성을 촉진한다는 큰 교훈을 보여준다”고 말했다. 다만 딥시크가 중국 정부나 시진핑 국가주석에 대한 민감한 정치적 질문엔 답변을 피하는 등 정부의 검열을 받는 점을 유일한 단점으로 꼽았다.
조재학 기자 2jh@etnews.com