원자력연, 원자력 특화 거대언어모델 ‘AtomicGPT’ 공개

2024-12-11

한국원자력연구원은 세계 최초로 원자력 분야에 특화된 인공지능 거대언어모델 ‘AtomicGPT’를 개발했다고 11일 밝혔다. 이번 모델은 전세계 언어모델이 공유되는 허깅페이스(Huggingface)에 온라인으로 공개됐다.

원자력연 디지털원자로·AI연구센터 인공지능응용연구실 유용균 실장과 염승돈 UST(과학기술연합대학원대학교) 석사과정 학생, 서울과학기술대학교 멀티모달자연어처리 연구실의 임경태 교수와 최창수 석사과정 학생이 공동으로 참여했다.

원자력연은 80억 개, 700억 개 파라미터 규모를 갖는 두 가지 버전의 AtomicGPT를 개발했다. 파라미터는 생성형 AI가 정보를 학습하고 기억하는 시냅스 역할을 하는데, 그 규모가 커질수록 답변의 수준이 높아진다. 작은 규모 버전은 빠르고 가볍게 사용하기 위해, 큰 규모는 어려운 질의 응답을 위해 사용한다.

연구진은 AtomicGPT를 원자력 분야에 최적화하기 위해 대량의 일반 지식과 원자력 분야 공개 논문, 사전, 규정집, 보고서 등을 학습데이터로 사용했다. 특히, 10년 이상 원자력 연구개발을 담당해 온 전문가들이 어휘와 지시문을 가공해 실사용에 적합하다.

원자력 특화 모델답게 연구원이 자체 개발한 성능 검사기준인 ‘원자력 분야 평가 기준(AtomBench)’에서 메타의 라마3.1(Llama3.1), 알리바바의 큐원2.5(Qwen2.5) 등 글로벌 기업의 언어모델보다 5~24% 이상 답변의 정확도가 높은 성능을 보이는 것을 확인했다.

원자력 분야는 일상에서 흔히 사용하지 않거나 다른 뜻으로 사용되는 전문용어가 많아 일반적인 ChatGPT를 활용한 검색은 그 한계가 명확했다. 특히 원자력산업은 보안이 중요한데, ChatGPT와 같은 상용 AI 모델은 보안에 취약할 수 있어 사용이 어렵다. 이때 AtomicGPT를 유용하게 활용할 수 있을 것으로 기대한다.

원자력산업의 핵심 업무인 각종 보고서 작성, 규제 준수 검토, 기술 검증, 표준화 절차, 형상 관리 등에 AtomicGPT를 활용해 업무 효율성을 크게 향상하고 인적 오류를 최소화하는 데 기여할 수 있다.

아울러 원자력연은 AtomicGPT를 문서 업무 활용에 그치지 않고, 원전 시뮬레이터를 제어하는 ‘원자로 AI 운전원’에 적용하는 연구를 수행 중이다. 이는 원자로 내 사고 상황을 예측하고 인간 전문가를 보조하는 역할을 하게 된다. 특히 원자로의 실시간 데이터를 기반으로 이상을 감지하고 잠재적 사고 상황을 예측해 원자력 발전소의 안전성을 향상하는 데 큰 도움을 줄 것으로 기대한다.

원자력연 인공지능응용연구실 유용균 실장은 “원자력 특화 거대언어모델을 누구나 사용하고 직접 학습할 수 있게 공개함으로써 원자력계의 산학연이 거대인공지능 연구에 협력할 수 있는 틀을 마련하고자 한다”며 “이를 통해 궁극적으로 원자력 발전소를 보다 안전하고 효율적으로 운영하는 인공지능 에이전트를 개발하고자 한다”고 밝혔다.

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.