AI 오픈소스, 美 이끌고 中 바짝 추격…韓은 이제 시작

2025-05-11

메타플랫폼 등 미국이 세계 인공지능(AI) 오픈소스 시장을 선도하는 가운데 알리바바·딥시크 등 중국 기업들이 추격하는 것으로 확인됐다. LG AI연구원 등 한국 기업도 존재감을 드러내기 시작했다.

11일 AI 오픈소스 커뮤니티 허깅페이스 데이터를 분석한 결과, 페이스북 운영사 메타가 지난달 공개한 최신 거대언어모델(LLM) 오픈소스 '라마4' 13종 중 최고 다운로드는 '라마4 스카우트 17B-16E 인스트럭트' 모델로 30일간 87만건에 육박했다.

전작인 '라마3' 공개 당시만큼 파급력이 없다는 평가에도 기록한 결과다. 지난달 공개된 다른 기업의 오픈소스 다운로드 수를 압도했다. 멀티모달을 탑재하고도 추론 기능이 없어 '라마4'가 저평가되는 상황이지만 '17B-128E 인스트럭트' 모델이 다운로드 약 9만건을 기록하는 등 관심은 지속되고 있다.

'라마3' 모델 등 누적 다운로드 수로 볼 때 메타가 생태계를 주도하고 있지만, 올해 들어 중국 기업의 오픈소스가 단일 모델로 크게 선전하고 있다. 딥시크 'R1', 알리바바 '큐원3'가 대표적이다.

중국 알리바바가 선보인 '큐원3' 27종 가운데 약 10일 만에 10만 다운로드를 돌파한 오픈소스가 7개였다. 압도적인 관심이다. 특히 '큐원3 0.6B'의 경우 31만 다운로드를 돌파했고 '8B'는 39만4000건으로 빠른 속도로 영향력을 확대하고 있다.

또 딥시크가 조용히 공개한 '프로브' 오픈소스의 경우 10일간 약 7400건 내려받았다. 671억 매개변수를 갖춘 '딥시크-V3'가 기반 모델이나 수학 특화 오픈소스로 한계가 있다는 분석이 나온다.

하지만 조만간 공개될 것으로 알려진 AI 추론 기능이 탑재될 'R2'의 경우, 2주 만에 100만 다운로드를 돌파한 전작 'R1'의 기록을 넘어설 것이라는 전망이 나오고 있다. 이외에도 바이두, 샤오미, 텐센트 등 중국 내 경쟁력 있는 AI 오픈소스를 공개하는 테크 기업이 많다는 것도 강점이다.

우리나라 기업도 허깅페이스에 언어모델 오픈소스를 공개하며 인지도를 높이고 있다. SK텔레콤이 2021년 KoGPT를 공개하는 등 과거에도 국내 기업 참여가 있었지만 올해부터 본격화됐다는 게 중론이다.

LG AI연구원이 3월 말 공개한 '엑사원 딥 2.4B'는 약 18만건 내려받은 것으로 집계됐다. 국내 기업이 공개한 지난달 단일 오픈소스 모델 중 최고 기록이다. '32B'가 약 12만건, '7.8B' 모델이 약 8만건으로 선전했다. 이들 3개 모델을 기반으로 구조·학습 방식 등을 변형·확장해 새롭게 개발된 파생모델도 총 71건으로 확장성도 입증했다.

네이버의 하이퍼클로바X 시드 오픈소스 3종은 공개 10일여 만에 5만여 다운로드를 기록했다. 한국어 특화 모델임을 고려할 때 선전했다는 평가가 나온다. 30억 매개변수 모델 '3B'가 3만 다운로드를 돌파, 국내에서 텍스트·이미지·영상정보를 처리하는 시각언어 AI 활용 수요가 높다는 것을 시사했다.

또 카카오가 2월 말 처음 공개한 '카나나 나노' 오픈소스 3종은 지난달 총 1만5000건을 내려 받은 것으로 나타났다. 파생모델은 22개로 선전했다. 이외에도 업스테이지 등이 자사 언어모델을 오픈소스로 공개하고 있다.

AI업계 관계자는 “한국 AI 오픈소스 기술 영향력은 이제 막 시작하는 단계”라며 “허깅페이스가 글로벌 AI 오픈소스 커뮤니티라는 점을 고려할 때 공개 첫 달에 최소 30만~40만 다운로드는 기록해야 영향력이 있는 모델이라는 게 개발자들의 인식”이라고 말했다.

박종진 기자 truth@etnews.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.