
올 4월 선종한 프란치스코 교황은 지난해 1월 ‘제58회 세계 소셜 커뮤니케이션의 날’을 맞아 낸 메시지에서 “인공지능(AI)은 세대 간에 정보 교환을 촉진하고 다양한 사람들이 완전한 소통을 하도록 기여할 것”이라고 말했다. AI가 언어와 세대로 인한 소통 장벽을 낮추고 결과적으로 인류의 정보 교환을 촉진할 기술이라는 평가다.
지난해부터 AI 기반 실시간 통번역 서비스가 실제 업무와 생활에서 활용되기 시작하면서 소통 도구로서 AI의 가능성은 현실화되고 있다. 실시간 AI 통번역 서비스는 해외 여러 국가 연사와 청중이 참여하는 컨퍼런스에서부터 다국어 온라인 회의, 상점의 접객까지 활용 분야가 지속적으로 늘고 있다. 이런 추세에 따라 메타·구글 등 빅테크는 물론 국내 IT 대기업과 중소·스타트업까지 고도화된 실시간 통번역 서비스를 내놓으며 언어장벽 해소에 가속도를 붙이고 있다.
AI 통번역, 컨퍼런스·화상회의서 일상화
국내 AI 통번역 시장 생태계도 확장되고 있다. 중소·스타트업 중에서는 플리토와 XL8이, 대기업에서는 삼성SDS(삼성에스디에스(018260))와 LG CNS(LG씨엔에스(064400))가 해당 분야에서 가장 두각을 나타내고 있는 것으로 파악된다. 플리토는 ‘라이브·챗 트랜스레이션’을 통해 컨퍼런스와 회의, 접객 등에서 활용되는 AI 실시간 통번역 시장을 적극적으로 공략하고 있다. XL8은 ‘이벤트캣(실시간 통역)’과 ‘미디어캣(번역)’을 선보임으로써 국내는 물론 해외 컨퍼런스, 미디어 시장을 겨낭하고 있다. 삼성SDS는 업무 자동화 생성형 AI 서비스 중 하나로 ‘브리티 미팅’을 제공 중이다. LG CNS도 업무혁신 에이전틱 AI 서비스에 포함된 ‘AX씽크 트랜스레이터’를 최근 공개하고 고객 확보에 박차를 가하고 있는 모습이다.

서울경제신문은 최근 국내에서 AI 실시간 통번역 서비스를 활발하게 개발·제공하고 있는 중소·스타트업의 대표와 대기업 담당자들에게 현재 기술 수준과 향후 발전 방향을 물었다. 이들은 한국어와 영어, 일본어, 스페인어 등 주요 언어 기준 AI 실시간 통번역 서비스의 완성도를 90% 중반대로 평가한다. 번역의 속도 측면에서는 이미 전문 통역가들의 수준을 뛰어넘었다는 평가도 나왔다.
‘F’와 ‘P’ 발음도 구분…음성인식·데이터가 서비스질 좌우
먼저 전문가들은 AI 실시간 통번역 서비스의 발전을 이끈 핵심 기술로 음성인식과 양질의 데이터 학습, 생성형 AI의 등장을 꼽았다. 이정수 플리토 대표는 “지난해부터 음성인식 기술이 사람 발언의 미묘한 부분까지 높은 정확도로 인식하는 수준으로 발전하면서 AI 실시간 통번역 서비스가 고도화될 수 있었다”고 설명했다. 이 대표는 이어 “음성 인식 기술의 정확도는 AI 학습을 접목하며 급발전했다”며 “통번역 엔진에 지속적으로 AI 학습을 접목하면서 헷갈릴 수 있는 사람의 이름이나 ‘F’와 ‘P’의 발음을 구분하는 수준에 이르게 된 것”이라고 덧붙였다.
삼성SDS 역시 음성인식 기술이 서비스의 질을 좌우하는 핵심 요소로 보고 있다. 우창균 삼성SDS C&C상품기획그룹장은 “AI 기술이 발전하면서 학습 효율이 비약적으로 향상됐고 다양한 언어의 인식 정확도 역시 크게 개선됐다”고 설명했다.
플리토와 XL8의 경우 데이터 학습의 중요성을 특히 강조했다. 정영훈 XL8 대표는 “인터넷에 떠도는 데이터를 모아 학습하는 것이 아니라 전문 번역가들이 쌓아온 데이터를 우리의 통번역 엔진에 학습시키고 있다”며 “지속적으로 우리의 통번역 데이터에 대해 전문 번역가들의 피드백을 받으면서 정확도 향상을 꾀하고 있다”고 설명했다.
플리토는 발언자에 대한 사전 데이터 확보의 중요성을 강조한다. 발언자에 대한 사전 데이터 학습은 여러 사람이 참여하는 회의보다는 대형 컨퍼런스에서의 강연 내용을 통역하는 데 더욱 큰 도움을 줄 전망이다. 이정수 대표는 “AI 실시간 통번역 서비스에서 음성인식과 버금가게 중요한 것이 초개인화”라며 “화자마다 억양과 주로 사용하는 단어, 관심사 등이 다른데 기존 강연이나 사전 정보를 학습함으로써 더욱 정확하고 풍성한 통번역 서비스를 제공할 수 있는 것”이라고 말했다.
생성형 AI로 문맥도 이해…전문 통역가 수준에 근접
또 전문가들은 챗GPT, 제미나이 등 생성형 AI 기술의 등장도 실시간 통번역 서비스의 발전을 이끌었다고 평가한다. 생성형 AI 기술을 활용해 이제는 단순 기계적인 번역을 넘어 문맥을 이해하고 의미를 자연스럽게 재구성해 통번역하는 것도 가능하게 됐다.
삼성SDS는 생성형 AI 기술이 실시간 통번역 서비스의 패러다임을 바꾸고 있다고 평가한다. 우창균 그룹장은 “앞으로는 AI 기술을 통해 대화뿐 아니라 회의 참석자의 표정, 억양, 제스처와 같은 비언어적 요소까지 전달할 수 있는 수준으로 발전할 것으로 예상한다"고 덧붙였다.
LG CNS도 생성형 AI 기술이 실시간 통번역 서비스의 정확도 향상에 크게 기여한다고 보고 있다. 구인호 LG CNS MWP AX서비스팀장은 “과거에는 다소 딱딱하게 직역되던 문장도, 생성형 AI를 활용하면 앞뒤 문장을 이해해 자연스러운 문맥으로 변환된다”면서 “발언자의 문맥 속 일부 단어가 약어로 사용되더라도 그 의미를 정확히 이해하고 번역할 수 있는 수준”이라고 평가했다.

속도와 정확도 향상 과제…온디바이스AI가 해결책
이들은 다만 아직 AI 실시간 통번역 서비스가 언어장벽을 완전히 허물었다고 보긴 어렵다고 진단했다. 통번역의 속도와 정확도 측면에서 보완해야 할 부분이 많다고 봤다. 속도는 발화자가 발언이 시작된 이후 3~5초 정도의 시간 차가 있으며, 정확도의 경우 아직 전문 통역가의 90% 중반대로 평가된다. 컨퍼런스나 일상적인 회의에서는 활용도가 높지만, 중요 계약 체결이나 국가 간 외교 회의처럼 한 치의 오역도 허용되지 않는 상황에선 전문 통역가의 도움을 받는 이유가 여기에 있다. 또 1:1 대면 대화에서는 통번역 시간 차로 인한 대화 공백이 생겨 어색한 상황이 연출되는 한계도 분명하다.
플리토는 속도를 개선하는 방법으로 온디바이스AI의 실현을 꼽았다. 이 대표는 “클라우드를 거치지 않는 온디바이스AI를 환경에서 실시간 통번역 서비스를 구현하면 속도를 단축할 수 있을 것”이라며 “AI 실시간 통번역에 적합하면서 기기 내에서 구동할 수 있는 AI 반도체 등이 개발돼야 할 것”이라고 말했다.
또 음성인식 기술이 더욱 향상돼야 한다는 지적도 나왔다. 구인호 팀장은 “주변 소음, 마이크 상태, 회의 공간에서 발화자의 울림, 사투리 등 외부 환경 요인으로 인해 음성 인식 품질이 떨어지지 않도록 성능을 개선해야 할 것”이라고 지적했다.
정확도에 대해선 시간의 문제라는 시각도 있다. 정영훈 대표는 “아직 AI는 고유명사나 사람 이름 등에 대한 구분을 잘 못하는 경우가 많지만 이런 문제는 앞으로 데이터 학습을 통해 차츰 개선될 수 있을 것”이라고 말했다. 정 대표는 또 “이미 인터넷과 교통의 발전으로 거리의 장벽은 없어졌다고 볼 수 있는 상황에서 언어의 장벽마저 허물어진다면 전 세계 사람들이 함께 창업하고 지구 반대편에 있는 사람들과 실시간으로 협업하는 것이 일상화될 것”이라며 “인류는 새로운 역사를 쓰게 될 것”이라고 덧붙였다.