
2024년 12월 오픈AI의 동영상 생성형 AI 소라(Sora) 첫 버전이 대중에게 공개됐다. 그 잠재력은 인상적이었지만 ‘불쾌한 골짜기(Uncanny Valley)’를 완전히 넘어서지는 못했다. 물리 법칙을 종종 무시했고, 인물의 일관성을 유지하는 데 애를 먹었다. 하지만 지난 9월 30일 공개된 소라 2는 이전 버전의 한계를 뛰어넘어 놀라운 도약을 이루었다.
이제 사용자는 “주인을 향해 달려가는 골든레트리버”와 같은 단순한 요청이 아니라 “1920년대 무성 영화 스타일로, 안개 낀 금문교를 배경으로 회한에 찬 표정을 짓는 늙은 탐정의 클로즈업 샷, 카메라는 그의 눈동자에 맺힌 눈물을 따라 천천히 줌 아웃한다”와 같은 복잡하고 감성적인 디렉팅까지 가능하다.
소라 2의 핵심은 ‘맥락적 일관성’과 ‘물리적 정확성’의 경이로운 향상에 있다. 영상 속 인물은 여러 장면에 걸쳐 같은 옷을 입고 같은 표정의 결을 유지하며, 자연스러운 미소, 흩날리는 머리카락 등 실제 촬영한 것과 같은 현실을 재현한다. 여기에 더해 사용자는 ‘카메오’ 기능으로 자신의 얼굴이나 특정 인물을 영상 속에 자연스럽게 등장시키고 개인화된 영화까지 손쉽게 만들어낼 수 있다.
심지어 생성된 영상에 어울리는 대사, 배경음악과 효과음까지 자동으로 삽입하는 ‘멀티모달(Multimodal)’ 능력은 콘텐츠 제작 공정을 파괴적으로 혁신한다. 소라 2는 단지 도구라기보다 스스로 생각하고 연출하는 AI 영상 감독의 탄생에 가깝다.
그러나 이 혁신의 그림자는 그 빛만큼이나 짙고 서늘할 것으로 예상된다. 우리는 이제 무엇을 믿어야 하는가? 소라 2는 정교한 가짜 뉴스와 정치적 프로파간다를 양산하는 가장 강력한 무기가 될 수 있다. 특정 정치인이 하지 않은 말을 하는 영상, 일어나지 않은 재난 현장을 담은 영상이 소셜미디어를 뒤덮는 세상. 진실과 거짓의 구분 자체가 어려워지는 ‘인식론적 대혼란’의 시대가 우리 눈 앞에 펼쳐지기 시작했다.
저작권 문제는 또 다른 폭풍의 핵이다. 소라 2가 학습한 수백만개 혹 그 이상의 영상 데이터 속에는 수많은 창작자의 피와 땀이 담겨 있다. AI가 생성한 결과물의 저작권은 누구에게 귀속돼야 하는가? AI가 학습한 데이터의 원작자인가, AI를 개발한 오픈AI인가, 아니면 프롬프트를 입력한 사용자인가? 현재의 법체계는 이 질문에 아무런 답도 내놓지 못한다. 미국 저작권청이 ‘인간의 창작성이 결여된 AI 생성물’에 저작권을 인정하지 않은 것은 미봉책에 불과하다.
소라 2는 곧 수많은 법적 분쟁과 창작 생태계의 붕괴를 예고하는 서막이다. 이는 일자리의 소멸을 넘어, 인간 고유의 영역이라 믿었던 ‘창의성’과 ‘예술’의 본질에 대한 근원적인 질문을 던진다. AI가 인간의 감성을 흉내 내고, 인간 창작자보다 더 뛰어난 예술을 만들어낼 때, 인간 창작자의 존재 이유는 무엇인가?
기술의 고삐를 쥘 이성과 윤리적 성찰이 그 어느 때보다 절실한 시점이다. 소라 2가 보여준 경이로운 신세계 앞에서, 우리는 이제 길을 잃지 않기 위해 어디로 가야 할지 답해야만 한다. 그 답을 찾는 것은 기술자가 아닌 바로 우리 모두의 몫이다.
<류한석 IT 칼럼니스트>