에임인텔리전스, AI 정밀 진단 시스템 ‘ELITE’로 글로벌 학회서 주목

은밀한 유해표현, 설득력 등 다양한 지표를 통해 AI의 잠재 위험성 탐지

에임인텔리전스가 연세대학교, KIST, 서울대학교와 공동으로 개발한 AI 안전성 진단 체계 ‘ELITE(Enhanced Language-Image Toxicity Evaluation)’가 머신러닝 학술대회인 'ICML 2025'에 공식 논문으로 채택됐다. 이는 국내 연구진이 글로벌 AI 안전성 연구 흐름을 선도하는 신호탄으로 해석된다.

ICML(International Conference on Machine Learning)은 인공지능 및 머신러닝 분야에서 가장 권위 있는 학회 중 하나로, 매년 전 세계 연구자들이 최신 기술을 발표하고 교류하는 자리다. 올해로 42회를 맞이한 이 학회에 국내 연구팀의 논문이 이름을 올린 것은, 한국 기술력의 실질적 성과가 국제적으로 공론화됐다는 점에서 의미가 깊다.

ELITE는 이미지와 텍스트를 함께 입력받는 비전언어모델(VLM)의 응답을 ‘정밀 진단’하는 평가 체계다. 단순히 노골적인 표현만을 걸러내는 기존 방식에서 나아가, 겉보기에 문제가 없는 응답 속에서도 은밀한 유해 표현, 설득력, 구체성 등 다양한 지표를 통해 AI의 잠재 위험성을 탐지한다.

연구팀은 기존에 활용되던 7개의 평가 프레임워크를 통합하고, 자체 제작한 고난도 테스트 1054건을 포함해 총 4587개의 실험을 수행했다. 이를 통해 유명 오픈소스 AI 모델 18종 중 10개 이상이 응답의 40% 이상에서 유해 발언에 노출된다는 결과를 도출해내며, 현존 AI 시스템의 취약성을 현실적으로 짚어냈다.

에임인텔리전스는 이번 성과를 바탕으로, 금융·의료·공공·로봇·국방 등 고위험 산업군에 특화된 AI 안전성 기준 수립을 추진하고 있다. 또한 한국정보통신기술협회(TTA) 등과의 협업을 통해 국내 AI 안전성 표준화 작업에도 참여 중이다.

유상윤 에임인텔리전스 대표는 “AI의 언어적 영향력이 커지는 만큼, 그 위험성을 정량화하고 기준화하는 작업이 절실하다”며 “ICML 채택은 그 방향성과 기술력을 동시에 인정받은 결과”라고 강조했다. 그는 이어 “누구나 안심하고 사용할 수 있는 AI 환경을 만들기 위해 국내외 협력을 강화하겠다”고 덧붙였다.

헬로티 서재창 기자 |