인공지능(AI)을 훈련하는 일을 했던 적이 있다. AI가 사용자의 질문에 답변한 내용을 보고 이를 수정하는 일이다. 이 과정을 통해서 인공지능은 더 정교해지고 인간의 언어를 더 잘 이해할 수 있게 된다. AI가 사실관계와 다른 답변을 내놓으면 일일이 이를 확인해서 수정했었다. 그러다 보면 깨닫게 된다. 결국 AI도 어느 정도 수준에 이르기까지는 인간의 손길이 필요하다는 것을.
결국 AI를 훈련하려면 엄청나게 많은 양의 데이터가 필요한데 이는 사람이 만들어야만 한다. 그리고 이 데이터의 질이 좋아질수록 AI는 더 똑똑해진다.
상황이 이렇다 보니 아마존, 마이크로소프트, 구글과 같은 거대기술기업(빅테크)들은 AI를 훈련할 양질의 콘텐츠를 찾아 헤매고 있다. 가장 발 빠르게 움직이는 곳이 AI업계의 선두주자로 불리는 오픈AI다. 오픈AI는 뉴스를 생산하는 미디어 기업으로부터 콘텐츠를 무단으로 사용해 AI를 훈련한다는 비판에 직면해왔다. 그래서 여러 언론사와 발 빠르게 콘텐츠 사용 계약을 맺는 중이다.
작년 12월, 정치 전문 매체 폴리티코와 경제 매체 비즈니스 인사이드를 소유한 악셀 스프링어와 콘텐츠 사용료로 매년 수천만 달러를 지불하는 계약을 확정했다. 올해 5월에는 월스트리트저널과 뉴욕포스트 등을 소유한 뉴스 코퍼레이션과 5년간 2억5000만 달러에 달하는 파트너십을 맺었다. 6월에는 대표적인 주간지 타임과 콘텐츠 제휴 계약을 체결했다. 구글도 이에 질세라 뉴욕타임스 등과 콘텐츠 제휴 계약을 맺으며 맞서고 있다.
언론뿐만 아니라 온라인 커뮤니티들 또한 AI의 러브콜을 받고 있다. 미국 최대 온라인 커뮤니티 레딧은 오픈AI는 물론 구글 등 빅테크와 수백만 달러 규모의 계약을 맺고 보유하고 있는 콘텐츠를 AI 학습에 제공하기로 했다. 이 때문에 레딧 주가는 폭등했고 레딧은 창사 이래 처음으로 흑자를 기록했다.
물론 이 과정에서 잡음도 있었다. 시카고 트리뷴과 오렌지카운티 레지스터 등을 포함한 일간지 8곳이 자사 뉴스를 무단으로 사용해 AI를 학습시켰다고 오픈AI에 소송을 제기했다. 출판계에서도 소송이 잇따르고 있다. 왕좌의 게임 원작자인 조지 R R 마틴 등 작가들도 오픈AI를 고소했다. 세상의 모든 콘텐츠를 다 집어삼킬 기세인 AI에 제동을 거는 일도 벌어지고 있는 것이다.
이처럼 많은 빅테크가 양질의 콘텐츠를 공급받으려고 안간힘을 쏟는 이유는 무엇일까? 역설적이게도 콘텐츠의 양은 많지만, 가치 있는 양질의 콘텐츠는 적기 때문이다. AI는 콘텐츠의 질을 감별할 수 있는 능력을 아직 갖추지 못했다. 현재로써는 콘텐츠를 제공하는 대로 학습하고 자라난다. 콘텐츠의 질이 무엇보다 중요하다는 의미다.
많은 사람이 문자로 되어 있는 콘텐츠의 위기를 이야기한다. 많은 사람이 글을 읽기보다는 영상을 통해 콘텐츠를 소비한다는 것이다. 누구나 영상 콘텐츠의 생산자가 될 수 있는 시대에 이는 너무 당연한 말일 수도 있다. 하지만 여전히 가장 양질의 콘텐츠는 문자를 통해서 유통되고 있다. 그리고 인류 역사상 가장 큰 혁신을 불러올 수도 있다는 AI가 이를 필요로 한다.
글을 쓰는 사람으로서 아직 문자 콘텐츠의 힘은 건재하다는 것을 다시 한번 느낀다. 양질의 콘텐츠를 생산하다 보면 높은 가치를 창출하게 된다는 믿음도 굳건하다. 그런 면에서 오픈AI와 협상을 하다 콘텐츠의 가치를 너무 낮게 평가한다며 제휴를 거부한 CNN의 사례는 콘텐츠의 힘에 대해 다시 생각하게 한다. 한 매체에 따르면 CNN의 경영진은 수천만 달러에 달하는 계약을 거절하면서 ‘단어 하나에 1센트 미만’의 가치를 부여하는 오픈AI와는 거래를 할 수 없다고 말했다고 한다. 콘텐츠의 힘과 가치를 믿기에 할 수 있는 발언이다.
조원희 / 경제부 기자