디플리 이수지 대표 인터뷰
AI 기술이 시각 인식을 넘어 청각 분야로 확장되는 추세다. 음성을 통한 상호작용이 일상화함에 따라, AI는 현대인의 일상 및 작업 환경을 효과적으로 변화시키고 있다. 디플리는 소리 기반 AI 기술을 통해 기존 산업의 효율성을 극대화하고 새로운 가치 창출을 목표로 삼았다. 이에 디플리 이수지 대표를 만나 회사의 창업 배경과 기술 발전 과정, 그리고 장기적인 로드맵에 대해 이야기 나눠봤다.
위험을 미연에 방지하는 ‘리슨 AI’
디플리는 위험 감지와 제조 분야에서 소리 데이터를 활용한 AI 솔루션을 개발해 주목받았다. 디플리가 개발한 ‘리슨 AI’는 비명, 충돌음, 기계 소음 등의 패턴을 실시간으로 분석해 산업 현장과 공공 장소에서의 안전 문제를 해결하는 데 유의미한 성과를 거두고 있다. 또한, B2B 중심으로 AI를 활용한 예지 보전 시스템을 도입해 제조업계의 효율성과 안전성을 모두 잡고자 한다.
특히 리슨 AI는 단순히 소리의 크기나 진동을 감지하는 것을 넘어, 복잡한 환경에서 여러 소리의 특징을 분석하고 패턴을 인식해 실제 현장의 상황을 실시간으로 판단할 수 있다는 점에서 차별화한다. 이러한 기술력은 지하철, 대형 쇼핑몰, 제조업 공장 등 다양한 환경에서 적용 가능하다. 또한, 청각적 요소가 상대적으로 취약했던 기존 AI 시스템에 비해 높은 수준의 정밀도를 보유해 산업 안전과 예지 보전에서 경쟁력을 발휘하고 있다.
리슨 AI는 이미 여러 공공 및 민간 프로젝트에 도입됨으로써 가능성을 입증했다. 대표적인 사례로는 정부세종청사와 강원랜드, 인천대입구역에서 진행한 안전 감지 솔루션이다. 정부세종청사 체육관에는 소리 분석 AI를 활용한 응급 상황 감지 시스템을 구축해 CCTV 시야가 닿지 않는 사각지대 위주로 10여 개소에 솔루션이 설치돼 있다.
강원랜드의 경우, 고객 간의 갈등으로 발생할 수 있는 위험 상황을 미리 감지해 즉각적인 대응이 가능하도록 했으며, 인천대입구역에서는 여성의 비명 소리나 폭력 상황을 포착해 관제센터에 신속히 알리는 기능을 수행하고 있다. 이수지 대표는 “소리가 발생한 후 몇 초 안에 분석과 경고가 이뤄져 현장에서 실질적으로 위험 상황을 방지할 수 있었다”고 말했다.
디플리가 제조업계에서도 주목받는 이유는 이러한 소리 분석 기술을 예지 보전 분야에 성공적으로 적용하기 때문이다. 디플리는 회전체나 모터 등 산업 현장에서 발생하는 소음을 분석해 기계 이상 여부를 조기에 감지하는 솔루션을 개발했다. 예를 들어, 제조업 현장에서 베어링이 고장 날 가능성이 있는 진동 패턴을 인식해 사고가 발생하기 전에 미리 경고하는 방식이다. 기존의 진동 센서 기반 시스템보다 정교하고 빠르게 반응할 수 있다는 점에서 제조 기업으로부터 높은 평가를 받았다.
이수지 대표는 “제조 현장에서 기계의 작은 이상을 조기에 발견하지 못하면 큰 사고로 이어질 수 있다. 하지만 현재의 진동 감지 시스템은 기계의 내부 소음이나 비정상적인 동작을 모두 탐지하기에는 한계가 있다. 디플리의 AI 솔루션은 여러 소음 신호를 종합적으로 분석해 기계의 작동 상태를 정밀하게 진단한다”고 설명했다. 이러한 기술력은 공장 운영자가 예기치 못한 기계 고장으로 인한 생산 중단을 방지하고, 유지보수 비용을 절감하는 데 기여한다.
“고품질 데이터 기반으로 안전 체계 확립할 것”
디플리가 개발한 AI는 방대한 데이터셋과 수많은 반복 학습 과정을 통해 소리가 발생한 상황을 맥락적으로 이해하는 데 중점을 둔다. 현재 디플리가 보유한 데이터는 5만 시간 이상에 달한다. 특히, 기존의 음향 데이터 외에도 다양한 상황별 소리 데이터와 글로벌 환경의 다양한 소리를 포함해 높은 정확도와 신뢰성을 확보하고 있다. 이처럼 디플리가 보유한 소리 데이터는 대표적인 강점 중 하나다. 디플리는 초기 B2C 사업을 진행할 당시, 가정에서 수집한 다양한 소리 데이터를 통해 AI 성능을 크게 개선하기도 했다.
이후 B2B로 전환한 디플리는 정교한 데이터 수집과 가공을 위해 인도와 같은 해외 현장에서도 데이터를 수집하며 글로벌 수준의 데이터셋을 구축하기도 했다. 인도의 혼잡한 거리 환경에서 차량 경적 소리와 비명 소리, 위험 신호음을 구별하는 데이터를 모아, 국내외의 복잡한 환경에서도 높은 정확도로 긴급 상황을 감지하는 모델을 만들었다. 이 같은 노하우는 단순히 음성 인식 기술을 뛰어넘어, 소리와 관련된 모든 비정형 데이터를 분석하고 분류하는 종합적인 솔루션으로 자리매김하게 했다.
현재 디플리는 다양한 산업 현장에 맞춤형 솔루션을 제공하며, 고객사의 필요에 따라 개별적인 맞춤형 모델을 구축하고 있다. 예를 들어, 제조업 현장의 경우 특정한 기계 소음이나 비정상적인 진동이 발생했을 때, 현장의 마이크와 서버를 통해 실시간으로 데이터를 수집하고, 이를 분석해 이상 여부를 파악한 후 빠르게 조치할 수 있도록 지원하고 있다.
기존의 진동 센서나 초음파 센서와의 결합을 통해 예측 모델의 정밀도를 높였고, AI가 스스로 학습하면서 정확도를 지속적으로 향상시키는 점이 특징이다. 특히 안전 분야에서는 일반적으로 설치된 CCTV와 연동해 시각적 데이터와 청각적 데이터를 함께 활용하는 방식으로 정확도를 높였다. 디플리는 이러한 멀티 모달 접근법으로 기술 적용 범위를 넓히고 있다.
나아가 디플리는 AI 소리 인식 기술을 기반으로 산업 전반의 안전과 생산성을 높이는 데 초점을 맞췄다. 이수지 대표는 “AI는 이제 단순히 인간을 보조하는 기술이 아니라, 사람의 청각과 같은 감각을 대신하거나 보완해주는 도구로 발전하고 있다”며, “우리는 향후 AI가 사람의 청각을 넘어, 복잡한 소리 환경에서도 상황을 이해하고 스스로 대처하는 수준으로 발전시킬 것”이라고 밝혔다. 이를 위해 디플리는 데이터셋 확장을 비롯해 새로운 알고리즘 개발과 파트너십 강화로 다양한 산업에 맞춤형 솔루션을 제공할 계획이다.
이와 함께 디플리는 하드웨어와 소프트웨어를 결합한 통합 솔루션을 개발해 시장 진입을 가속화할 계획이다. 단순히 소프트웨어만을 제공할 뿐 아니라, 다양한 환경에서 최적의 성능을 발휘하도록 맞춤형 마이크와 서버를 함께 제공하는 것이다. 예를 들어, 제조업 현장에서는 고주파 소음과 진동을 감지할 수 있는 특수 마이크를 사용하고, 건설 현장이나 지하철 같은 소음이 많은 환경에서는 소음을 필터링하는 기능을 추가해 정확도를 높였다.
이를 통해 디플리는 각 산업 현장에 맞는 최적의 솔루션을 제공함으로써 AI 소리 인식 기술의 활용 가능성을 넓혀갈 예정이다. 끝으로, 이수지 대표는 “우리의 목표는 단순히 소리를 분석하는 AI 솔루션을 제공하는 것에서 나아가, 모든 산업의 안전과 효율성을 혁신하는 종합 플랫폼으로 자리 잡는 것이다”고 강조했다.
헬로티 서재창 기자 |