논란의 中 ‘딥시크’ Q&A
챗GPT와 다른 점은
딥러닝 AI 모델·텍스트 답 같지만
‘오픈소스’ 기반 무료 공개는 차이
문제가 되는 이유는
키보드 입력 패턴 등 무차별 채집
이용자 데이터 中 서버 저장 관리
정부·민간 대처 현황은
보안 우려… 업무용 PC 접속 차단
개인정보위, 정보 처리·약관 분석
중국의 생성형 인공지능(AI)인 ‘딥시크’의 이용자 개인정보, 민감 정보 유출 우려가 커지며 정부 부처와 지방자치단체, 기업 등이 딥시크 접속 차단에 나서고 있다. 개인정보보호위원회와 국가정보원, 관련 업계 분석 등을 토대로 딥시크가 미국 오픈AI 챗GPT와 같거나 다른 점, 딥시크에 대한 정부 대처 등을 일문일답으로 정리했다.
![](https://img.segye.com/content/image/2025/02/09/20250209509576.jpg)
―딥시크가 챗GPT와 같은 점은.
“‘거대 언어 모델(LLM·Large Language Model)’에 기반한 생성형 AI다. LLM이란 인터넷 등에서 수집된 방대한 자료를 사람이 이해할 수 있는 문장으로 바꿔 이용자가 쉽게 이해할 수 있게 정보를 제공하는 딥러닝 AI 모델이다. 또 질문하면 텍스트로 답해 준다.
![](https://img.segye.com/content/image/2025/02/09/20250209509580.jpg)
―딥시크가 챗GPT와 다른 점은.
“폐쇄형인 챗GPT와 달리, 딥시크는 ‘오픈 소스’를 기반으로 한다. 오픈 소스란 소프트웨어 개발에 필요한 소스 코드를 누구나 쓸 수 있게 무료로 공개하는 것이다. 딥시크는 기존 코드를 활용해 개발 비용을 단축했다. 딥시크는 ‘V3’ 개발에 557만6000달러(약 81억원)가 들었다고 밝혔는데, 이는 오픈AI ‘GPT-4’ 개발비로 알려진 1억달러의 약 5.6%에 불과하다. 딥시크는 또 지난달 선보인 추론 모델 ‘R1’의 소스 코드를 일반에 공개했다.
![](https://img.segye.com/content/image/2025/02/09/20250209509575.jpg)
―딥시크가 논란인 이유는.
“딥시크는 챗GPT 등과 달리 이용자가 자신의 개인정보 수집·활용을 거부할 수 있는 옵션, 이른바 ‘옵트아웃(opt-out)’이 없다. 이에 따라 이용자의 이름과 생년월일, 이메일 주소 등 개인정보는 물론, 이용자가 입력하는 각종 데이터, 이용자의 키보드 입력 패턴까지 수집한다. 이 정보들은 중국 내 서버에 저장돼 중국 법에 따라 관리된다. 정보 유출 우려가 제기되는 이유다.”
―딥시크 답변의 신뢰도는.
“챗GPT, 네이버 클로바X는 언어와 무관하게 같은 질문에 동일하게 답한다. 반면 딥시크는 중국 관련 민감한 질문에 대한 답변이 언어별로 다르다. 일례로 ‘동북공정이 정당한가’란 한국어 질문에 ‘주변 국가와의 역사적 해석 차이로 다양한 시각이 존재한다’고 답하지만, 중국어와 영어로 물으면 ‘중국 동북 지역 활성화를 위한 정당한 이니셔티브. 중국 이익에 부합’이라고 한다.”
―딥시크 접속을 차단한 정부 부처나 기관 등 현황은.
“지난 3일 행정안전부가 보안 유의 사항 공문을 보낸 뒤 대다수의 중앙 부처와 기관이 업무용 PC의 딥시크 접속을 차단했다. 서울시 등 지자체, 롯데·신세계 그룹 등 기업, 주요 시중은행과 증권사들도 딥시크 접속 금지에 나섰다.”
―딥시크에 대한 정부 대처와 향후 계획.
“개인정보위는 딥시크와 관련해 보안상 우려가 제기되고 있는 만큼 신중한 이용을 당부한다. 지난달 31일 딥시크 측에 개인정보를 포함한 데이터 수집 항목·목적, 수집·이용·저장 방식, 공유 여부 등 핵심 사항을 질의해 둔 상태다. 딥시크의 개인정보 처리 방침, 이용 약관 등도 분석 중이다.”
박진영 기자 jyp@segye.com
[ⓒ 세계일보 & Segye.com, 무단전재 및 재배포 금지]