
“AI 디지털교과서를 전국 학교에서 사용하면서 교육 데이터가 쌓이고 있다. 그러나 규제로 교육데이터 개방이 이뤄지지 않아 활용할 방안이 없다.”
“교육 데이터를 공공부문에서 개방해야 미래 교육 활성화에도 도움이 될 것이다.”
AI 디지털교과서 도입 이후 교육 데이터를 공개해야 한다는 교육업계의 목소리가 커지고 있는 가운데 정부가 안전한 교육데이터 활용체계 구축을 위한 연구에 착수해 관심을 끈다. 2023년 12월 교육데이터전략위원회를 구성, 운영해 '교육데이터 개방·활용 확대방안'이 수립·의결된 지 1년 4개월여 만이다.
그동안 교육 데이터에 관한 연구 수요는 많았으나, 한정된 데이터만 공개해 실질적 교육데이터 활용에는 어려움이 많았다. 정부는 문제 해결을 위해 수능, 학업성취도 등 데이터는 일정 기간이 도래한 경우 비식별 처리 후 공개하는 교육데이터 개방·활용 활성화 4대 원칙을 공표한 바 있다.
한국교육학술정보원(KERIS)은 '안전한 교육데이터 활용체계 구축 연구' 제안요청서 사전규격을 공지했다. 오는 10월 말까지 연구 용역을 진행해 내부 검토를 거쳐 이르면 연내로, 늦어도 내년 초에는 안전한 교육데이터 활용체계를 마련한다는 계획이다. 앞서 국토교통부와 산업통상자원부, 과학기술정보통신부는 이달부터 데이터 안심구역을 통한 빅데이터를 민간이 활용할 수 있도록 개방했다.
KERIS 관계자는 “이번 연구는 정책 시행보다는 안심구역에 관한 정확한 객관적 가이드 라인 마련을 위해 진행한다”며 “현재 안심구역에서 취급되는 정보에 대한 기준을 세워나가겠다”고 말했다.
이번 연구 용역을 통해 교육데이터 안심구역 구축에 따른 운영 대상 교육데이터를 분류한다. 데이터 안심구역은 '데이터 산업진흥 및 이용촉진에 관한 기본법'에 따라 과학기술정보통신부와 관계부처가 지정한 보안통제 공간이다. 민감하거나 미개방 데이터를 기술·물리·관리적으로 보호하면서 분석하도록 지원하는 제도다. 데이터안심구역은 현재 전국 8개 기관, 10곳에 지정돼 있으며 교통, 고용, 보건 등 다양한 분야의 미개방 데이터를 제공한다.
부처 지정 온라인 데이터 안심구역, 오프라인 데이터 안심구역, 개인정보 안심구역 등 안심구역 전체 대비 KERIS 안심구역 현황에 대한 갭(gap) 분석도 실시한다. 국내외 안심구역 관련 운영 사례와 안전성 보장 방안 조사 및 시사점도 도출한다.
이와 함께 안심구역 반입 대상 교육데이터 분류 및 위험성을 검토한다. 분류체계는 개인정보 유무 및 유형 분류, 개인정보 특성 분류 등으로 나눈다. 심사용 및 공개용 교육데이터에 대한 가명·익명 처리방안도 살펴본다. 향후 제공되는 교육 데이터 가운데 해당 업무 수행 시 요청되는 주요 데이터에 대해서는 데이터 이상치 파악 및 오류 스크리닝, 서술형 데이터 정제 등도 수행한다.
KERIS는 안심구역 운영 정책도 수립한다. 위험성별 안전조치 절차 및 방안, 현황대비 안심구역 지정을 위한 대응전략 등 정책과 지침을 마련한다. 안심구역 내 연구데이터 활용 안내서도 작성한다. 데이터 및 개인정보 안심구역 지정도 지원한다.
타 부처보다 교육부의 데이터 개방이 늦은 것이 아니냐는 의견도 나온다. 이와 관련해 교육부는 데이터 관련 정책이 출발 단계라는 입장이다. 교육 데이터가 가진 민감성이 크기 때문이다. 교육부 관계자는 “현재 EDSS 시스템을 통해 교육데이터를 개방하고 있을 뿐 아니라, 조만간 교육 데이터 안심구역을 구축해 나갈 방침”이라면서 “데이터 활용과 공개와 관련해서는 시도교육청과의 협의도 필요하다”고 밝혔다.
한편, 정부의 교육데이터 개방·활용 활성화 4대 원칙에 따르면, 교육분야 데이터는 네거티브 방식으로 전면 전환해 원칙적 개방한다. 수능, 학업성취도 등 데이터는 일정 기간이 도래한 경우 원칙적으로 비식별 처리후 공개하고 소재지 정보는 시·군·구 또는 하급교육행정기관 단위로 공개한다. 정책연구 등 공익적 목적의 경우, 수요기반 맞춤형 비정형 데이터 생성 및 제공을 확대한다. 데이터 표준화 체계를 구축하고 교육분야뿐 아니라 인재·사회 분야의 생애주기별 데이터 연계·활용 확대를 위한 기관 협력을 강화한다.
마송은 기자 running@etnews.com