'한국형 딥시크' 키운다…개인정보위, 오픈소스 기반 AI 스타트업 지원 논의

개인정보보호위원회가 중국 생성형 인공지능(AI) ‘딥시크’의 등장으로 오픈소스 AI 생태계에 대한 사회적 관심이 높아진 상황에서 국내 AI 스타트업들을 만나 지원 방안을 논의했다고 24일 밝혔다.

고학수 개인정보위 위원장은 이날 서울 강남구의 스타트업 얼라이언스 엔스페이스(&Space)에서 AI 스타트업 관계자들을 만나 현장의 애로·건의 사항을 청취하고, 오픈소스 기반의 국내 AI 생태계 발전 방안을 논의했다.

오픈소스는 프로그램 개발 시 필요한 소스코드나 설계도를 누구나 확인할 수 있도록 공개하는 방식을 뜻한다. 적은 비용으로 고성능 AI 모델에 누구나 접근할 수 있지만 추가학습, 검색증강생성(RAG) 등을 거쳐 상용화하는 과정에서 개인정보 처리가 수반돼 주의가 필요하다. 개인정보위가 간담회에 앞서 진행한 설문조사에 따르면 10개 기업 중 6개 기업에서 오픈소스 모델에 기반한 응용 서비스를 출시했다. 또한 오픈소스 모델을 자체 보유한 이용자 데이터 등으로 추가 학습하거나, RAG를 통해 보강해 성능 개선에 활용한다고 답했다.

이번 간담회에 참석한 국내 AI 스타트업 관계자들은 오픈소스 모델을 적극적으로 연구·활용한 주요 성과와 사례 등을 공유했다. 대표적으로 스캐터랩의 하주영 변호사는 오픈소스 모델과 제반 기술을 적극적으로 연구해 장점을 흡수하기 위한 노력을 설명하고 구글 젬마, 딥시크 등 글로벌 오픈소스 모델이 국내 AI 생태계에 미치는 파급력에 대해 발표했다.

발표 이후 진행된 자유 토론에서는 간담회에 참석한 기업들이 생성형 AI 개발·도입 과정에서 경험한 데이터 및 개인정보 관련 다양한 애로·건의 사항을 제시했다. 대부분 기업들은 자사 또는 고객사가 보유한 이용자 데이터를 AI 개발에 활용하는 경우 발생하는 법적 불확실성 문제가 있다고 밝혔다. 이를 위해 적법한 이용자 데이터 활용을 위한 명확한 법적 기준 안내, 익명·가명 데이터 처리를 위한 구체적 방법론과 비식별 데이터에 대한 재식별 평가기준 마련 등 다양한 건의사항이 제기됐다.

개인정보위는 AI 신산업 발전을 지원하고 현장 불확실성 해소를 위해 ‘원칙 기반 규율’ 하에서 구체적 데이터 처리 기준을 제시한 사례 등을 소개했다. 이어 데이터 활용 장벽 해소를 위해 최근 제3차 국가인공지능위원회를 통해 발표한 ‘AI 데이터 확충 및 개방 확대방안’의 주요 내용도 설명했다.

개인정보위는 이번 간담회 논의 결과를 바탕으로 국내 AI 확산 추세에 맞춰 중소·스타트업 등에게 실질적인 도움이 될 수 있는 개인정보 관점에서의 맞춤형 ‘생성형 AI 도입·활용 안내서’를 마련할 계획이다. 고학수 개인정보위 위원장은 “우리나라의 경쟁력 있는 AI 혁신 생태계 발전을 위해서는 오픈소스 이점을 최대한 활용할 필요가 있다”며 “국내 기관·기업에서 오픈소스 AI를 도입·활용하는 과정에서 AI·데이터 처리와 관련된 리스크 요인이 최소화될 수 있도록 중소·스타트업 업계와 긴밀히 협력해 나가겠다”고 밝혔다.