한국형 ‘베수비오 챌린지’가 진행돼 눈길을 끌고 있다. 베수비오 챌린지는 베수비오 화산 폭발로 폼페이와 함께 파묻힌 고대 도시 헤르클라네움의 고대 파피루스 속 문장을 해독하는 대회다. 인공지능(AI) 발달로 화산재에 파묻혀 있던 고문서를 2000년 만에 해독하고 고대 그리스의 철학자 플라톤이 묻힌 장소를 특정하는 등 그 성과가 작지 않다.
국제학술지 ‘네이처’는 최근 이 같은 베수비오 챌린지를 소개하면서 조선왕조실록 번역 작업을 소개했다. 14세기부터 20세기 초까지 27명의 조선 왕들의 통치 기간을 다룬 수십만 편의 기록에 대한 아카이브(기록 보관) 작업이다. 네이처는 조경현 뉴욕대 교수가 한자를 한글로 단순 번역하는 작업이 아닌 현대 한국어로 AI모델을 학습시키고 있다는 점을 강조했다. 조 교수는 “데이터의 양이 방대하다”며 “연구팀은 한자를 사용해 고대 한국어 번역과 제한된 수의 현대 한국어 번역을 사용해 다국어 접근 방식을 통해 번역을 하고 있다”고 설명했다. 조선왕조실록에 드러난 국빈 방문, 반역자 처벌, 연회와 같은 일련의 사건이 AI 번역을 통해 고대 한국어와 현대 한국어를 거쳐 번역되는 방식인 셈이다. 이는 AI 학습 모델의 일종인 ‘트랜스포머 모델’이다.
이 방식을 통해 그리스 파트라스대는 크레타주 크노소스에서 온 1100개의 미케네 석판에서 누락된 텍스트를 복원하기도 했다. 해당 석판에는 기원전 미케네 문명에 사용된 리니어B문자로 양떼에 대한 기록이 적혀 있었다. AI는 학습을 통해 생성된 테스트에서 상위 10개의 텍스트를 도출했는데 이 가운데 72%가 실제 문자에 가까웠다. 이 같은 방식으로 리니어B를 해독하다보면 더욱 난해한 리니어A까지 AI가 해독할 것으로 기대된다. 리니어 문자가 해독되면 아직 미지의 영역인 미노아 문명의 실마리도 찾을 수 있을 것으로 전망된다.
이 같은 AI 번역 성과는 지난해 8월 방콕에서 열린 컴퓨터언어학협회 연례회의에서 조선왕조실록 번역 발표를 통해서도 확인된다. 소개된 기록에 따르면 1495~1506년 국정 운영에서 왕의 자의적인 결정이 급격히 늘어났다. 당시 왕은 연산군이었다. 1623~1649년은 정반대인데 반정에 의해 권력을 잡은 인조 시대라는 점에서 신권이 상대적으로 강해 왕의 자의적 결정이 쉽지 않았다는 점을 파악할 수 있다. 즉 AI가 고대 텍스트 번역에 머물지 않고 보다 입체적인 문화 전반을 새롭게 비추게 될 것이라는 해석이다.
조 교수팀은 조선왕조실록뿐만 아니라 한자를 공유하는 일본·한국·중국·베트남의 언어들을 연결하는 작업을 하고 있다. 당시 아시아 세계를 시간과 공간으로 연결할 수 있다는 기대에서다. 데이터 마이닝 접근 이상의 역사적 출처에 대한 AI의 적극적인 추론과 대화를 통해 고대 텍스트의 잠금 해제를 목표로 하고 있다.