‘국가대표 AI’ 선정 사업에 참여 중인 업스테이지가 최근 불거진 자사 인공지능(AI) 모델 ‘솔라 오픈 100B’(솔라 오픈)의 중국 모델 도용 논란에 정면 반박했다. 모델의 구조는 글로벌 표준을 따랐지만, 그 지능을 결정하는 알맹이는 직접 만들어낸 독자 모델이라는 주장이다.

무슨 일이야
김성훈 업스테이지 대표는 2일 오후 공개 검증회를 열고 ‘솔라 오픈’ 모델이 다른 모델을 파인 튜닝(미세 조정)한 모델이 아닌, 초기 단계부터 독자적으로 구축한 ‘프롬 스크래치(from scratch)’ 방식으로 개발됐다고 강조했다.
이번 검증회는 AI 스타트업 사이오닉AI의 고석현 대표가 ‘솔라 오픈이 중국 AI 스타트업 즈푸AI의 AI 모델 GLM을 기반으로 만들어졌다’는 의혹을 제기한 데 따른 것이다. 고 대표는 전날 자신의 소셜미디어(SNS)에 “국민 세금이 투입된 프로젝트에서 중국 모델을 복사해 미세 조정한 결과물로 추정되는 모델이 제출된 것은 상당히 큰 유감”이라고 언급하며 솔라와 GLM의 유사성을 분석한 보고서를 게재했다.
업스테이지는 뭐래
논란의 핵심은 업스테이지의 솔라 오픈이 ‘독자 개발’이냐 아니냐다. 업스테이지가 참여 중인 정부의 독자 파운데이션 모델 선정 사업은 ‘소버린 AI’를 표방하고 있다. 이미 있는 모델을 조정해서 쓰는 방식이 아니라, 독자적으로 구축한 AI 모델을 개발하는 것이 핵심이다.
김 대표는 솔라 오픈이 프롬 스크래치 모델임을 증명하기 위해 모델 가중치와 로스(오답률) 그래프 등을 공개해 설명했다. 가중치는 AI가 판단을 내리는 데 사용하는 숫자 값을 말한다. 김 대표는 “이 숫자를 어떻게 집어넣는지가 가장 어려운 문제”라며 “랜덤하게 숫자를 집어넣은 후 학습을 했느냐, 일부라도 다른 사람의 결과물을 가져왔느냐가 프롬 스크래치냐 아니냐를 가르는데 솔라 오픈은 이 숫자를 초기화시켜 무작위로 학습시켰다”고 주장했다.
모델 구조가 GLM과 흡사하다는 지적에 대해서는 글로벌 호환성을 위한 선택이라고 해명했다. 김 대표는 “현재 AI 생태계의 모델 구조는 허깅페이스(글로벌 AI 공유 플랫폼)에 있는 오픈소스 코드로 거의 표준화되어 있다”고 했다. 이어 “이미 만들어진 로마 시대 길 사이즈에 맞춰 마차를 만드는 것과 같은 이치”라고 비유했다. 완전히 새로운 구조를 만드는 것은 오히려 오픈소스 생태계와의 연결을 방해하는 비효율적인 일이라는 취지다.
이날 업스테이지는 9월부터 11월 말까지 AI의 학습 로그들을 공개하기도 했다. 김 대표는 이 기록을 AI의 성장 기록이 담긴 ‘육아일기’에 비유하며 “초기에는 로스(오답률)가 높았다가 학습이 진행되며 점차 낮아졌다”고 말했다. 이 로스 그래프가 AI 모델이 사실상 아무것도 없는 상태에서부터 학습을 시작했음을 보여주는 증거가 된다는 것이다.
김 대표는 다만 의혹 제기 직후 모델 라이선스 명단에 뒤늦게 즈푸AI가 추가된 배경에 대해서는 “국가 과제 제출 기한에 맞춰 모델 가중치 학습에 힘을 쏟다 보니 라이센스를 바로잡았다”라고 밝혔다.
앞으로는

업계에서는 업스테이지의 모델이 정부가 요구하는 ‘독자 파운데이션 모델’ 규정에 부합하는지 주목하고 있다. AI 업계에서는 독자 개발로 볼 수 있다는 게 중론이다. 익명을 요구한 한 AI 스타트업 관계자는 “(챗GPT 등 대화형 AI 모델의 기반 기술인) 트랜스포머 기반의 AI 모델은 사실상 구조가 비슷비슷하다보니 구조의 차별성보다는 학습 데이터가 독자 개발에 중요하다고 볼 수 있다”고 했다. 다만 한 AI 업계 교수는 “대기업 등 일부 기업들은 구조부터 직접 만드는 작업을 하고 있다”며 “스타트업들이 많이 사용한다고 해서 업스테이지의 개발 방식을 독자 개발이라고 볼 것인가는 정부의 판단이 이뤄져야 할 부분”이라고 말했다.








![[人사이트]김진우 라이너 대표, “AI 검색·에이전트로 지식 노동 혁신”](https://img.etnews.com/news/article/2025/12/29/news-p.v1.20251229.32b05457ce9140c7b0ed12cc3c997744_P1.jpg)