"범용 AI 모델 학습에 사용된 콘텐츠 공개해야"
세계 최초의 포괄적인 인공지능 규제 법안으로서 EU 모든 회원국에 대해 직접 구속력을 갖는 EU AI Act는 유럽 의회와 이사회를 차례로 통과하여 2024. 7. 1. EU 관보(the Official Journal of the European Union)에 공포되었고, 각 규정은 2024. 8. 1.부터 순차적으로 시행된다. 아래에서는 EU AI Act의 내용 중 AI 시스템 제공자 등의 표시의무와 저작물의 학습 데이터로서의 사용에 관한 사항을 주로 살펴본다.
1. 표시의무 규정
EU AI Act 제4장의 제50조는 투명성 의무로서 아래와 같이 특정한 AI 시스템 제공자 및 배포자에게 AI 산출물임을 공개적으로 명시하는 등 표시의무를 규정한다.
먼저 '제공자'(Provider)는 AI 시스템 또는 범용 AI 모델을 개발하여 시장에 출시하거나 자신의 이름 또는 상표로 AI 시스템의 서비스를 제공하는 자연인, 법인, 공공기관, 기관 또는 기타 단체(제3조 3항)를 말하는데, 이들은 AI 시스템이 자연인과 직접 소통하도록 디자인 · 개발된 경우 AI와 상호작용하고 있다는 사실을 알려야 하고(제50조 1항), 합성 오디오, 이미지, 비디오 또는 텍스트 콘텐츠를 생성하는 경우 AI 시스템의 산출물이 기계 판독 가능한 형식으로 표시되고 인위적(artificially)으로 생성되거나 조작된 것으로 감지할 수 있도록 보장해야 한다(제50조 2항).
또 다른 표시의무 수범자인 '배포자'(Deployer)는 AI 시스템을 자신의 권한 하에 사용하는 자연인, 법인, 공공기관, 기관 또는 기타 단체를 말하며, AI 시스템이 개인적 · 비전문적 활동 과정에서 사용되는 경우는 제외한다(제3조 4항). 이들은 감정 인식 시스템 또는 생체 분류 시스템에 자연인이 노출되는 경우 시스템의 운영 사실을 알려야 하고(제50조 3항), 딥페이크 이미지, 오디오, 비디오 콘텐츠를 생성 또는 조작하는 경우 해당 콘텐츠가 인위적으로 생성되거나 조작되었음을 공개하여야 한다(제50조 4항 전단). 또한 공공의 관심사가 되는 사안을 공중에 알리기 위한 목적으로 발표되는 텍스트를 생성 또는 조작하는 AI 시스템 배포자는 해당 텍스트가 인위적으로 생성되거나 조작되었음을 공개하여야 한다(제50조 4항 후단).
의무 면제 예외 함께 규정
위 표시의무 규정은 딥페이크 등으로 인한 사실 오인 위험으로부터 이용자를 보호하기 위한 목적이므로, 예컨대 표준적 편집을 위한 보조적 도구로만 사용되는 경우 혹은 형사범죄의 감지, 방지, 조사 또는 기소를 위하여 법률에 의하여 수권을 받은 경우 등(위 제 50조 2항 등) 의무가 면제될 수 있는 예외도 규정하고 있다. 의무의 불이행 시 1,500만 유로 또는 이전 회계년도 전세계 연간 매출액의 3% 중 다액을 한도로 하여 과징금이 부과될 수 있다.
나아가 표시 방식에 대해서도 규정을 하고 있다. 합성 오디오, 이미지, 비디오, 텍스트 콘텐츠를 생성하는 AI 시스템 제공자의 경우 AI 시스템의 산출물을 기계 판독 가능한 형식으로 표시하여야 할 뿐만 아니라, 제공자가 효과적이고, 상호 운용 가능하고(interoperable), 견고하며(robust), 신뢰할 수 있는 표시 방법에 관한 기술 솔루션을 제공해야 하며(제50조 2항), 딥페이크 이미지, 오디오, 비디오 콘텐츠를 생성 또는 조작하는 AI 시스템 배포자도 해당 콘텐츠가 명백하게 예술적, 창작적, 풍자적, 가상적 또는 유사한 작업 또는 프로그램의 일부를 구성한다면, 콘텐츠의 전시 또는 향유에 지장을 초래하지 않는 적절한 방식으로 의무를 이행하도록 규정한다(제50조 4항 전단). 또한 동조 제7항에서는 AI 사무국(AI Office)이 EU 차원에서 인위적으로 생성 또는 조작된 콘텐츠의 탐지 및 표시를 위한 효과적인 실천 규범을 마련하도록 촉진할 것을 선언하였다.
다만, 이와 같은 규정에도 불구하고 아직까지 콘텐츠 별로 어떻게 표시의무를 다르게 이행하는지 등 구체적인 실천 방안에 대해서까지 뚜렷한 답을 제시하고 있지는 못하고 있다. 표시의무에 관한 제50조는 2026. 8. 2.부터 시행되는데, 그때까지 AI 산업 및 기술의 발전 과 관련 세부 실천 규범의 마련이 어떻게 이루어지는지, 그리고 그에 따라 EU AI Act의 적용 범위와 실효성이 어떻게 나타나는지 지켜볼 필요가 있겠다.
2. 데이터 학습에서의 저작물 사용
EU AI Act 제5장에서 범용 AI 모델에 관하여 규정하는데, 제53조가 저작권 관련 내용을 규정한다. 범용 AI 모델이란 대규모의 자기지도(self-supervision)학습을 이용하여 대량의 데이터를 학습하고, 상당한 범용성을 갖추고 시장에 출시되는 방식과 관계없이 다양한 과업을 능숙하게 수행할 수 있으며, 다양한 다운스트림 시스템 및 어플리케이션에 통합 가능한 AI 모델을 포함하되, 다만 시판 전 연구 · 개발 또는 시제품 제작 활동에 사용되는 AI 모델은 제외된다(제3조 63항).
범용 AI 모델 제공자는 ①저작권 및 관련 권리에 관한 EU법을 준수하며 특히 최첨단 기술을 통하여, EU 디지털 단일시장 저작권 지침(이하 "EU 지침") 제4조 제3항에 따라 명시된 권리 유보 사항을 식별 및 준수하기 위한 정책을 수립해야 하고(제53조 1항 c), ②AI 사무국에서 제공하는 양식(template)에 따라 범용 AI 모델의 학습에 사용된 콘텐츠에 대하여 충분히 자세한 요약을 작성하여 대중에게 공개해야 한다(제53조 1항 d). 이러한 요약은 저작권자들로 하여금 자신의 콘텐츠가 범용 AI모델의 학습에 활용되었는지 여부를 확인할 수 있도록 하며 향후 권리 행사를 위한 전제가 될 수 있을 것이다.
위 제53조 1.(c)에서 인용하는 EU 지침 제4조 제3항은 권리자가 적절한 방식으로 명시적으로 권리를 유보하지 않은 경우에는 텍스트 · 데이터 마이닝(Text and Data Mining, TDM)을 위하여 필요한 범위에서 합법적으로 접근 가능한 타인의 저작물을 사용할 수 있다고 한다. 위 규정은 상업적 목적 등 그 이용 목적 및 실행주체에 대한 제한이 없고, '적절한 방식'이란 온라인을 통해 공중이용 가능한 콘텐츠의 경우에는 기계 판독 가능한 수단 등을 말한다.
저작권 관련 규정은 2025. 8. 2. 시행된다. TDM과 관련한 위 제53조 1.(c)를 준수하기 위하여 범용 AI 모델의 학습이 타인의 저작물을 대상으로 하는 경우 그 저작물에 대한 권리 유보 여부를 확인하고, 필요한 경우 해당 저작물을 학습 데이터에서 제외(opt-out)하는 절차와 시스템 마련이 필요할 것이다.
3. 시사점
EU AI Act는 인공지능에 관하여 포괄적인 법안이 입법된 첫 사례이다. 다른 국가들의 AI관련 제도 수립에 있어서 EU AI Act가 모델 또는 참고가 될 것이라는 점에서 그 내용을 정확히 파악하고, 향후 세부 지침 마련 등 실무 동향을 지속적으로 확인할 필요가 있다.
최근 딥페이크 콘텐츠가 전 세계적으로 문제됨에 따라 AI 컨텐츠의 위험성에 관한 관심이 매우 높아졌으며, 구글의 SynthID, OpenAI의 DALL-E 3, 메타의 Stable Signature 등에서는 AI로 생성 또는 변형된 콘텐츠임을 표시하고 식별하는 워터마크 기능을 제공할 것임을 공표하기도 하였다. 우리나라에서도 인공지능기본법안 등 AI 산출물 표시의무와 관련된 여러 개의 법안이 국회에 상정되어 있는바, 이러한 업계 동향을 모니터링하면서 표시의무의 대상 및 주체 등 주요 쟁점에 대한 깊이 있는 고민이 필요할 것이다.
또한 우리나라는 저작물에 대한 TDM 예외규정이 입법되지 아니하였으나 AI 모델의 저작물 학습 관련하여 공정이용 규정(저작권법 제35조의 5)에 의한 저작권 제한 가부 및 이용 대가 산정이 논의되고 있는바, 본질적인 AI 관련 이해당사자와 법적 문제는 어느 국가에서든 유사할 것으로 보인다. 따라서 데이터 학습에서의 저작권 쟁점과 관련하여서도 AI-저작권 제도개선 워킹그룹을 운영하는 문화체육관광부를 포함한 정부의 정책 발표 및 국회의 입법 동향을 주목할 필요가 있다.
김형지 · 유지수 변호사(김앤장 법률사무소, hyungji.kim@kimchang.com)