
인공지능(AI) 시대 데이터 중요성이 부각되는 가운데 정부가 공공 중요 데이터 개방에 속도를 낸다. 단순 데이터 개방에만 초점을 두지 않고 실제 현장에서 필요한 중요 데이터를 개방, 실질적 효과를 창출할 계획이다.
한국지능정보사회진흥원(NIA)은 최근 이를 위한 '수요중심 공공데이터 개발 확대를 위한 중요데이터 선별 기준 및 관리방안' 사업을 발주했다.
NIA는 AI 산업에 필요한 데이터를 적극 개방하기 위한 전략 마련이 필요함을 강조했다.
기존 공공 데이터 개방이 단순 개방에 그쳤다면 민간 실질 수요에 맞는 맞춤 데이터 개방·관리가 필요하다는 게 정부측 판단이다.
이를 위해 중요데이터의 개념부터 정립한다. 개방 우선순위 선정 관점에서 중요데이터의 개념을 정의하고 속성, 활용 범위, 목적 등을 구체화한다.
예를 들어 '국민 생활과 밀접하며 민간 활용 수요가 많은 실시간·공공 서비스형 데이터'로 기준을 잡는다면 기상청 CCTV 기반 도로·날씨 정보, 암예방·검진 데이터 등이 구체적 데이터 목록이 될 수 있다.
'생성형AI 학습에 적합한 고품질·정형화된 인공지능 훈련 데이터'의 경우 산불 위험 예보 분석 이미지, 토마토 개화 이미지 데이터, 지하철 역사 내 CCTV 이상행동 영상 샘플데이터 등이 구체 데이터로 분류된다.
이 같은 중요데이터 선별 기준에 이에 맞는 데이터 목록을 만들어 우선순위에 맞춰 개방을 추진할 방침이다.
기존 행정·서비스 중심 분류 방식이 아니라 △미디어 △안보 △질병 △마케팅 등 도메인 요구사항과 데이터 특성·목적 등을 고려한 분류 기준을 만든다.
개방 우선순위 설정 역시 단순 규모만 따지는게 아니라 △데이터 파급력 △활용 가능성 △사회현안 연계성 등을 수치나 기준으로 평가할 수 있는 지표를 개발해 적용한다.
실제 공공 현장에서 중요데이터 개방에 나설 수 있도록 공공데이터 개방 '정성평가' 지표에 중요데이터 목록을 활용할 계획이다.
NIA는 “활용가치·AI 적용 가능성·경제적 파급력 등을 반영한 정량적·정책적 우선순위 기준 미흡으로 실제 민간 기업·학계 등에서 수요가 높은 데이터에 대한 체계화된 전략적 개방이 어려웠다”며 “체계적·효율적 공공데이터 개방을 위해 중요데이터를 선별, 데이터 개방 우선순위를 정하는 전략적이고 명확한 기준을 만들 것”이라고 전했다.
김지선 기자 river@etnews.com