
[환경포커스=국회] 국회 기후에너지환경노동위원회 김주영(더불어민주당, 김포시갑) 의원실이 16일 국가기상슈퍼컴퓨터센터에서 받은 <슈퍼컴퓨터 고장 및 오류 현황>에 따르면, 최근 5년간 슈퍼컴퓨터 핵심 부품인 스토리지 서버 고장 8건으로, 올해만 3건의 고장이 발생한 것으로 나타났다.
기상청에서는 슈퍼컴퓨터 1호기 1999년 첫 도입을 시작으로 현재는 2019년에 도입한 슈퍼컴퓨터 5호기를 운영 중이다.
우리나라 슈퍼컴퓨터의 성능은 세계 슈퍼컴퓨터 순위 사이트 ‘TOP500’ 기준(2025년 6월) 세계 7위 수준으로, 미국·중국·독일·일본·프랑스·이탈리아에 이어 높은 성능을 보유하고 있다.
슈퍼컴퓨터는 각국의 과학기술력과 기후대응 역량을 상징하는 핵심 장비로, 최근 몇 년간 세계 주요국 간 치열한 경쟁이 이어지고 있다.
기상청의 슈퍼컴퓨터 5호기는 2019년 7월 계약을 완료하고 2021년 6월 설치가 완료되었다.
설치 이후 장애 및 오류 현황을 보면 ▲2021년 디스크 교체 후 저장장치 재구성 중 스토리지 장애(3.2), 스토리지 서버 비정상 작동(1.4)으로 2건 ▲2022년 스토리지 서버 비정상 작동(1.2), 계산시스템 일부 노드 비정상 종료(1.4) 2건 ▲2024년 스토리지 서버 비정상 작동(1.2) 1건 ▲2025년 9월까지 스토리지 서버 비정상 작동(1.4), 일부 스토리지 서버 비정상 작동(2회, 10.3, 3.3) 3건 총 8건의 장애가 발생했다.
또한 주요 설비 고장도 지속적으로 발생했다. ▲2022년 냉동기 1호기 (압축기 내부 SCR 모듈 및 소프트스타터 PCB 불량 교체, 수리기간 11일) ▲2024년 냉동기 2호기 (냉수 출구온도센서 불량 교체, 24시간 이내), 냉동기 1호기 (압축기 “Calibration Fault” 발생으로 원제조사(미국) 수리, 289일), 무정전전원장치 (정류기 및 IGBT PCB 불량교체, 24시간 이내), 냉동기 4호기 (냉동기 팽창밸브 컨트롤러 파라미터값 재설정, 2일)의 고장이 발생하였다.
다만, 기상청은 주요설비 고장 시 예비용 냉동기 전환 운영 및 UPS 병렬운영 등으로 슈퍼컴퓨터 운영에는 영향 없었다고 밝혔다.
한편 ‘국가기상슈퍼컴퓨터센터 기반시설 통합유지보수 용역’ 제안요청서에 따르면, 고장 수리 비용은 월 유지보수 금액의 20% 이하일 경우 계약상대자가 부담하고, 이를 초과하는 비용은 기상청이 부담하도록 규정되어 있다.
또한 장애 신고가 접수되면, 관련 기술자가 즉시 현장에 출동해 슈퍼컴퓨터 운영에 직접적인 영향이 있는 설비의 경우 1일 이내, 자동제어나 보안설비 등 간접 설비의 경우 3일 이내에 복구를 완료해야 한다. 이를 초과할 경우, 초과 일수에 해당하는 금액만큼 월 지급대가에서 공제하도록 되어 있다.
이에 지난해에는 냉동기 1호기 압축기 3번 고장으로 인해 원제조사인 미국에서 수리를 진행했으며, 총 수리비용 4,300만 원 중 2,300만 원은 유지보수업체가, 2,000만 원은 기상청이 부담했다. 수리 지연(288일)에 따른 위약금 3,368만 원은 국고 세입으로 조치됐다.
국가기상슈퍼컴퓨터는 전 세계에서 수신되는 각종 기상관측 자료를 기반으로 수치예보모델을 운영해, 미래 날씨 변화에 대한 과학적 예측자료를 생산하고 기상청 예보관과 유관기관에 신속히 제공하는 핵심 인프라이다.
따라서 시스템 장애는 곧 기상정보 제공 지연, 예보 정확도 저하, 재난 대응 차질로 이어질 수 있어 국민 안전에 직접적인 영향을 미친다.
김주영 의원은 “돌발적 폭우, 태풍, 이상기상이 늘어나는 지금, 예보 시스템의 안정성은 그 어느 때보다 중요한 상황이다”며 “슈퍼컴퓨터는 국민 안전을 지탱하는 ‘기후안전망’의 핵심 인프라이다”고 강조했다.
이어 김 의원은 “기상청은 반복되는 장애 원인을 면밀히 분석하고, 안정적인 운영체계 구축에 나서야 한다”고 지적했다.