[비즈 칼럼] AI-Ready 공공 데이터: AI를 위한 맞춤형 ‘요리 재료’

2025-11-26

지난해 노벨 화학상은 실험실의 플라스크가 아닌 ‘인공지능(AI) 알고리즘’에서 비롯됐다. 구글 딥마인드 창업자인 데미스 허사비스와 존 점퍼는 단백질 구조를 예측하는 AI 모델 ‘알파폴드(AlphaFold)’를 개발한 공로로 노벨상을 받았다. 알파폴드는 지난 50년 동안 과학계가 축적해 온 방대한 데이터 덕분에 탄생할 수 있었다. 17만 개에 이르는 단백질 구조 정보와 대량의 단백질 서열·주석 데이터를 학습하며 질병 예측과 진단의 정확도를 크게 높인 것이다. 이처럼 혁신적 AI 서비스의 출발점은 바로 ‘데이터’다.

최근 글로벌 AI 기업들은 앞다퉈 데이터 확보 경쟁에 뛰어들고 있다. 챗GPT를 개발한 기업은 뉴스 콘텐트를 데이터로 활용하기 위해 언론사와 협약을 맺고 있으며, 또 다른 기업은 데이터를 정교하게 가공하는 전문 기업에 투자해 데이터 활용 권리를 확보하고 있다. 데이터를 얼마나 확보하고, 어떻게 활용하느냐가 AI 산업의 핵심 과제가 되고 있다.

반면에 국내 기업들은 데이터 접근과 확보에 여전히 어려움을 겪고 있다. 지난 9월 국내 110개 기업·기관 임원을 대상으로 실시한 설문조사에서 ‘데이터의 양·품질 부족’ ‘데이터 가공·정제 비용 부담’이 주요 문제로 지적됐다. 특히 공공 데이터는 부처마다 형식과 용어가 달라 기업들이 이를 가공하고 정제하는 데 큰 비용과 시간이 소요된다.

AI 서비스가 ‘요리’라면 데이터는 ‘식재료’와 같다. 갓 수확한 채소나 생선을 바로 요리에 쓸 수 없듯, 데이터도 원천 상태로는 활용이 어렵다. 흙을 씻고 알맞게 손질된 재료처럼 AI가 즉시 활용할 수 있는 형태와 품질로 데이터가 제공되면 기업들은 혁신적 AI 서비스를 쉽고 편리하게 개발할 수 있다.

이처럼 AI 활용이 쉽도록 정제·가공된 데이터를 ‘AI-Ready 데이터’라고 한다. 정부는 이를 공공 데이터에 처음으로 도입할 계획이다. 식재료에 영양 성분과 원산지를 표시하듯 데이터에 갱신 주기, 변경 이력, 출처 등의 정보를 담아 AI가 이해하기 쉬운 형식으로 제공할 것이다. 또한 주소·행정코드 등 주요 식별값을 표준화하고 데이터 품질을 높여 어떤 서비스에서도 쉽게 활용할 수 있는 공공 데이터를 제공할 예정이다.

정부는 내년부터 보건·의료·교통 등 주요 데이터를 중심으로 ‘AI-Ready’ 기준을 적용해 공공데이터포털에 제공하고, 전 부처에 확산할 계획이다. 우리 기업들이 이를 바탕으로 국민의 일상을 더욱 편리하게 만들 혁신적인 AI 서비스를 선보이길 기대한다. 기업들이 창의적인 AI 서비스 레시피를 마음껏 펼칠 수 있도록, 정부는 양질의 공공 데이터를 정성껏 준비해 나가겠다.

윤호중 행정안전부 장관

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.