엔씨소프트, AI 음성 합성 기술 '멀티버스 TTS' 공개

2024-10-08

적은 데이터로 다국어 음성 제작

게임 캐릭터 음성 개발에 활용

[서울=뉴스핌] 양태훈 기자 = 엔씨소프트가 8일 게임 음성 제작 과정에 활용할 수 있는 인공지능(AI) 모델 'Zero-shot Multi-verse TTS(멀티버스 TTS)'를 공개했다.

멀티버스 TTS는 3초 분량의 음성 데이터만으로도 다양한 발화 스타일 변환과 다국어 음성 제작이 가능한 기술이다. 이 기술을 활용하면 제한된 음성 리소스로 고품질의 AI 캐릭터 보이스를 제작할 수 있어, 기존 음성 작업에 소요되던 시간과 비용을 크게 절감할 수 있다.

엔씨소프트 측은 "단일 모델로 여러 언어와 기능을 가진 TTS를 구현해 다국어 음성 콘텐츠를 제작할 수 있다"며 "경쟁 TTS 모델에 비해 상대적으로 적은 운용 비용으로 고품질의 음성 생성 서비스를 제공한다"고 설명했다.

멀티버스 TTS 기술의 우수성은 세계적 권위의 인공지능 기술 학회인 EMNLP(Empirical Methods in Natural Language Processing)에 관련 논문이 게재되면서 입증됐다.

엔씨소프트는 이 기술을 활용해 연내 100종의 게임 캐릭터 음성을 제작할 계획이다. 또한 NPC(non-player character)의 성격과 상황에 맞는 음성을 제작하는 조절 기능도 지속적으로 개발할 예정이다.

dconnect@newspim.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.