AI가 만든 코드, 더 안전하고 똑똑하게...개발자 마음까지 이해
C/C++ 특화 데이터셋 구축으로 AI 코드 생성 한계 극복

국내 연구진이 AI이 소스코드를 자동으로 생성할 때 기능과 품질을 함께 보장하는 핵심 기술을 새롭게 선보였다. 단순히 코드를 빠르게 만드는 수준을 넘어, 개발자의 의도와 함께 안정성·보안성 등 품질 요소까지 반영한 고품질 코드 생성이 가능하다는 점에서 주목받고 있다.
최근 AI는 ‘로그인 기능을 만들어줘’ 같은 자연어 명령만으로 실제 실행 가능한 코드를 자동으로 생성할 정도로 발전했지만, 종종 보안 취약점, 논리 오류, 유지보수 어려움, 확장성 부족 등의 문제를 드러내곤 했다.
한국전자통신연구원은 대규모 언어모델을 활용해 소스코드를 보다 정확하고 안전하게 생성할 수 있는 핵심 기술을 개발했다.
이번 기술은 AI·소프트웨어 엔지니어링(SE)·프로그래밍 언어 분야의 융합을 통해 개발된 것으로, AI의 코드 생성 능력을 한층 고도화했다. 단순히 코드를 빠르게 만드는 수준을 넘어, 소프트웨어가 반드시 갖추어야 할 품질과 신뢰성까지 보장한다는 점에서 의미가 크다.
연구진은 기존 코드 생성기술이 기능 구현에만 집중했던 한계를 넘어, 시스템의 품질과 신뢰성 등 비기능 요구사항까지 반영할 수 있는 구조적 코드 생성 기술을 개발했다.
예를 들어 로그인 기능을 요청하면 단순한 인증 로직뿐 아니라 입력 검증, 예외 처리, 계정 잠금 등 품질 관리 요소가 함께 반영된 코드를 자동으로 생성한다. 파일 처리 기능의 경우에도 대용량 데이터 처리 효율과 메모리 관리 등 성능 요소를 고려해 코드가 구성된다. 이 연구에는 서울대학교 연구진도 함께 참여했다.
ETRI는 이번 기술 개발과 함께 C/C++ 언어에 특화된 대규모 학습 데이터셋을 자체 구축했다. C/C++ 언어는 운영체제, 반도체, 임베디드 시스템 등 산업 핵심 분야에서 널리 쓰이지만, AI 학습용 데이터가 부족해 코드 생성 성능이 떨어지는 한계가 있었다.
연구진은 코드 수집 → 품질 평가 → 명세 생성의 전 과정을 자동화한 데이터 구축 시스템을 개발해, 약 4만 건의 고품질 C/C++ 특화 훈련 데이터셋을 확보했다. 이 데이터를 최신 AI 모델 4종에 적용한 결과, 모든 모델의 코드 품질이 향상되었으며, 훈련 데이터의 품질과 양이 AI 코드 생성의 핵심 요인임을 입증했다.
ETRI는 지난달 29일 서울 엘타워에서 ‘PULSE 코드 자동화 오픈소스 기술 워크샵’을 개최하고 관련 주요 연구성과를 공개했다. 이 자리에서는 ▲오토코딩 공통 인프라 ▲프롬프트 최적화 기술 ▲C/C++ 데이터셋 구축 및 과정 ▲AI 모델 성능 개선 결과 등을 연구진이 직접 소개했다.
특히 ETRI는 이번 행사를 통해 범용 소프트웨어 개발을 넘어 산업 도메인 특화 서비스로 기술을 확장하는 전략적 방향을 제시했다. 또한, 로봇 제어, 차량용 소프트웨어 자동화 등 주요 산업 분야를 대상으로 실증 및 협력 프로젝트를 추진 중이라고 밝혔다.
연구성과의 확산과 활용을 위해 관련 기술 일부를 연구원 깃허브(GitHub)를 통해 오픈소스로 공개했다.
이번 기술은 개발자와 기업뿐 아니라 임베디드·자동차·로봇 등 산업 분야 종사자, 연구·교육 기관에서도 폭넓게 활용될 수 있다. 특히 코드 품질과 보안성이 중요한 산업 환경에서 개발 속도와 효율성을 동시에 확보할 수 있는 혁신적인 해법으로 평가된다.
이번 과제를 통해 ▲SCI급 논문 5편 ▲세계 최고 수준 학회인 ACL을 포함한 국제 우수학술대회 논문 20편 ▲국내·외 특허 출원 11건 ▲기술이전 2건 등 우수한 성과를 달성했다. ETRI는 현재 국내 주요 기업들과 PoC(개념 검증) 협력을 추진 중이며, 향후 3~4년 내 상용화를 목표로 하고 있다.
[전국매일신문] 정은모기자
J-em@jeonmae.co.kr
저작권자 © 전국매일신문 - 전국의 생생한 뉴스를 ‘한눈에’ 무단전재 및 재배포 금지


![[대전 차세대 디지털 선도기업]〈1〉 노타, 일상 속 AI 보편화 실현 기술로 세계 시장 이끈다](https://img.etnews.com/news/article/2025/11/07/news-p.v1.20251107.9e692b414e344a4da78c15beeb773f1e_P1.jpg)



