국가바이오빅데이터 10만 넘어…2026년 첫 개방 추진

2025-12-01

국가통합바이오빅데이터사업에 데이터를 기증한 참여자가 10만명을 넘어섰다. 당초 목표에는 못 미치지만 하반기 들어 기증자가 빠르게 늘면서 내년에는 30만명 이상 확보할 것으로 기대된다. 이르면 내년 하반기 확보한 데이터를 연구자에 첫 개방하는 동시에 인공지능(AI)을 접목, 연구 지원에 나선다.

1일 정부기관에 따르면 국가통합바이오빅데이터사업단은 11만명 규모의 임상, 유전체 데이터를 확보한 것으로 알려졌다. 사업단 발족 약 11개월 만에 10만명을 넘어섰다.

이 사업은 참여자의 자발적 동의에 기반해 혈액, 소변 등 검체와 진료, 유전체 데이터를 하나로 모은 '데이터뱅크' 구축이 핵심이다. 2032년까지 100만명 데이터를 확보, 국민 건강증진 정책이나 질병 진단·치료법 개발에 활용한다.

지난해 12월 사업단 출범 당시 올해 말 19만~20만명 데이터를 확보할 것으로 기대했다. 하지만 38개 모집기관의 시스템 구축과 외부요인 등으로 올해 3월에서야 본격적으로 데이터 기증이 시작됐다.

지난달 데이터 기증 참여자가 10만명을 돌파한 가운데 연말까지 12만명 가량 확보할 것으로 보인다. 출발이 다소 늦었지만 시간이 갈수록 일평균 800~900명의 기증자가 나오면서 데이터 확보에 속도가 붙고 있기 때문이다. 이 추세라면 내년 30만~40만명까지도 가능하다는 분석이다.

백롱민 국가통합바이오빅데이터사업단장은 “2032년까지 100만명의 바이오빅데이터를 확보하기 위해선 하루 평균 1000명의 기증자가 있어야 하는데, 현재 매일 800~900명 수준의 기증자가 나타나고 있다”면서 “데이터 기증은 계획대로 진행 중이며, 이제는 모은 데이터 정제 및 표준화 등 작업을 해야 한다”고 말했다.

사업단은 내년에도 데이터 확보에 집중하면서 연구자 등에 제공하는 개방 작업도 시작할 계획이다. 첫 출발은 하반기 오픈 예정인 '바이오빅데이터 플랫폼'이다. 확보한 바이오 빅데이터를 병원, 대학, 민간기업 등에 안전하게 개방하는 역할을 맡는다. 3분기 중 플랫폼 구축을 완료하고, 4분기 중 첫 데이터셋 개방이 유력하다.

또 내년부터는 희귀질환 데이터의 경우 기증자 질병 치료에 도움이 되게끔 주치의에게 진단 청구용 보고서 형태로 제공한다. 기증자에 대한 혜택을 제공하기 위함이다.

인공지능(AI) 접목도 추진한다. 사업단은 이르면 내년 말까지 바이오빅데이터를 활용할 AI 모델 개발 계획을 수립할 예정이다. 바이오빅데이터 플랫폼에 적용해 연구를 지원할 거대언어모델(LLM)이나 AI 에이전트 개발 등이 유력하다.

백 단장은 “수집한 빅데이터를 어떻게 활용할지 다양한 방안을 검토 중”이라며 “연구 플랫폼에 AI 프레임워크를 적용해 데이터를 분석하고, 의미 있는 내용을 도출할 수 있도록 툴(도구)로 활용할 계획을 세우고 있다”고 말했다.

정용철 기자 jungyc@etnews.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.