“시리야” 부르던 그 AI 아니다…이젠 당신이 욕해도 받아친다

2025-05-29

Factpl Interview

‘3P’ AI 비서 꿈꾸는 구글

안젤라 선 제미나이 라이브 디렉터 PM

스마트 안경과, 프로젝트 무한, 차량에 내장된 안드로이드 오토와 스마트워치…. 지난 20~21일 미국 캘리포니아 마운틴뷰에서 열린 연례 개발자 행사 I/O에서 구글은 인공지능(AI) 제미나이와 결합한 새로운 기기들을 줄줄이 선보였다. 모양과 크기, 용도 다 제각각인 기기들이지만 공통점이 있다. 사람을 방불케하는 현란한 말솜씨를 갖췄다는 점. 구글은 안경과 같이 텍스트를 입력하기 어려운 형태의 기기에 제미나이의 음성 대화 기능 ‘제미나이 라이브’를 붙였다. 덕분에 스마트폰과 PC에만 갇혀있던 AI 어시스턴트(비서·에이전트)는 경계를 허물고 어떤 기기에도 녹아들 수 있는 범용성을 갖추게 됐다.

말솜씨를 갖춘 AI는 우리의 미래를 어디로 이끌고, 어떤 변화를 가져올까. AI도 사람처럼 ‘음’,‘아...’ 같은 추임새 넣는다는데, 왜 이렇게까지 하는 걸까. 팩플은 구글 I/O 현장에서 안젤라 선 제미나이 라이브 디렉터 PM을 만나 음성 AI에 대해 직접 물었다. 제미나이 라이브 기술 개발 파트를 총괄하는 선 PM은 “음성 AI는 AI 업계의 다음 스텝인 범용 AI 어시스턴트로 나아가기 위한 핵심”이라고 강조했다.

1. 5살 눈높이 맞추는 제미나이

시리, 빅스비 등 그간의 음성 AI 비서는 어색한 말투, 부자연스러운 화법으로 사용자들에게 외면받아 왔다. 그런데, 구글은 왜 음성에 주목했을까.

자연스러운 음성 AI를 만든 이유는.

AI 기반 챗봇이 변화하는 과정에서 자연스러운 언어는 매우 중요하다. 여기에는 목소리뿐만 아니라 사용하는 단어나 표현 방식, 억양까지 포함된다. 사용자와 신뢰를 쌓는 것도 중요하지만, 사용자의 언어 수준, 말투, 속어까지 반영해서 ‘사용자가 있는 그 자리’에 맞춰가는 게 더 중요하다. 신뢰라는 관점에서 볼 수도 있지만, (AI가) ‘내가 편하게 말할 수 있는 친구이자 어시스턴트’라는 관점에서 받아들일 수 있게 해야 한다는 의미다. 5살 아이가 쓰는 영어와 내가 쓰는 영어는 전혀 다르지 않나. 개개인에 따라 대화를 이해하기 쉽게 맞춰주는 게 정말 중요하다.

AI의 자연스러운 음성이 사람들이 대화하고 싶게 만든다는 의미인가.

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.