사진 '한 장'으로 초실사 AI 아바타 만든다…ETRI, 차세대 인터페이스 기반 구현

2025-04-15

인물 사진 한장만으로 사람처럼 자연스럽게 말하는 초실사 인공지능(AI) 아바타 생성 기술이 국내에서 개발됐다.

정교한 표정, 입 모양 표현으로 실제 사람과 같은 자연스러운 대화가 가능해 보다 인간 친화적인 사용자 경험을 제공할 수 있다. 향후 완전 자율주행 시대를 대비해 직관적인 차량·사람 간 상호작용을 가능케 하는 차세대 인터페이스구현 기반이 된다. 디지털 휴먼 산업 전반으로 확산도 기대된다.

한국전자통신연구원(ETRI)은 모빌리티UX연구실 연구진이 이 같은 성과를 거뒀다고 15일 밝혔다.

기술 핵심은 기존 생성형 AI와 달리 입술·턱 등 발화와 직접 연관된 부위를 선별 학습·합성하는 독자 알고리즘이다. 불필요한 정보 학습을 줄이는 한편, 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교화했다.

ETRI는 기술이 CVPR, AAAI 등 국제 주요 학술대회 발표 기술보다 '합성 화질'과 '입술 동기화 성능' 면에서 우수한 성능을 입증했다고 설명했다.

기술은 자율주행차 외에 △키오스크 △은행 창구 △뉴스 진행 △광고 모델 등 다양한 산업 분야에서 활용 가능하다.

윤대섭 모빌리티UX연구실장은 “모빌리티 기술이 고도화될수록 노인이나 사회적 약자들이 소외될 수 있다”며 “AI 아바타 기술이 디지털 리터러시(정보 이해·표현 능력) 향상에 기여하고, 모두가 쉽게 이용할 수 있는 스마트 모빌리티 서비스로 발전하길 기대한다”고 말했다.

연구책임자인 최대웅 선임연구원은 “AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직이는 생성형 AI 기술을 한층 고도화할 계획”이라며 “향후 주문·상담 등 일부 인력을 대체할 상호작용 구현을 목표로 하고 있다”고 소개했다.

기술은 ETRI 기술이전 사이트에 '실사 인물 발화 영상 생성 프레임워크 기술'로 등록됐다. 연구진은 다양한 산업 분야 기술이전 및 사업화도 적극 추진할 계획이다.

김영준 기자 kyj85@etnews.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.