
이스트소프트(047560)가 인공지능(AI) 휴먼 영상 제작·오토 더빙 서비스 ‘페르소닷에이아이(RERSO.ai)’에 다화자 보이스 클로닝과 스크립트 편집 등 새로운 기능을 대폭 추가했다고 17일 밝혔다.
이번 업데이트를 통해 탑재된 ‘다화자 보이스 클로닝’ 기술은 영상 속 화자의 음성을 인식하고 복제하는 오토 더빙 서비스 ‘AI 비디오 트랜슬레이터’의 적용 대상을 기존 1명에서 10명으로 대폭 확대했다. 여러 인물이 등장하는 인터뷰나 토론 영상 번역에서도 자연스럽고 일관된 결과물을 얻을 수 있다. 특히 한국어 대화의 특성을 반영한 AI 학습 모델을 적용해 한국어 음성 인식 정확도를 글로벌 최고 수준으로 끌어올렸다. 립싱크 기술도 대폭 개선해 입술 움직임 패턴 및 주변 상황을 분석해 더욱 정밀한 결과물을 생성할 수 있도록 했다.
오토 더빙 콘텐츠의 완성도를 높일 ‘스크립트 편집’ 기능도 새롭게 추가됐다. AI 비디오 트랜슬레이터에서 생성한 번역 스크립트를 사용자가 수정할 수 있는 환경을 제공한다. 문화적 맥락이나 전문 용어 등 AI가 놓칠 수 있는 부분을 사용자가 직접 보완할 수 있도록 했다. 이 기능은 모바일 환경에서도 사용 가능하다.
이스트소프트는 이와 함께 AI 비디오 트랜슬레이터의 팀 요금제를 새롭게 출시하면서 서비스 이용 접근성을 개선했다. 회사는 페르소닷AI의 팀 단위 협업을 더욱 효율적으로 지원하기 위해 팀 플랜, 멤버 초대·권한 관리 시스템, 크레딧 공유 메커니즘, 협업 워크플로우 등 팀 요금제를 출시하고 다양한 기능을 추가했다.
김생근 이스트소프트 페르소 서비스형소프트웨어(SaaS) 센터장은 “이번 업데이트는 한국 크리에이터들의 글로벌 진출을 더욱 가속할 것”이라며 “현재 3000만 구독자를 보유한 50개 이상의 파트너 채널과 협력 중이며 올해 상반기 중 이를 500개 채널, 총 1억 구독자 규모로 확대할 계획”이라고 말했다.