유니닥스, 헬스케어 sLLM 허깅페이스에 무료 공개

2024-10-18

유니닥스가 자사의 인공지능 솔루션 ‘ezMyAIDoctor’에 활용된 헬스케어 sLLM(소형언어모델)을 허깅페이스에 무료로 공개했다고 18일 밝혔다.

이번에 공개된 sLLM은 유니닥스의 ezMyAIDoctor에서 사용되는 모델로, 인공지능산업융합사업단(AICA)의 AIDC-HPC 사업의 결과물이다. 이 모델은 NIA의 AI 허브에 공개된 ‘초거대 AI 헬스케어 질의응답 데이터’를 바탕으로 Meta의 LLaMA 3.1 모델을 추가로 사전 학습시키고, SFT 및 DPO 등 미세 조정을 거쳐 개발됐다.

이번 sLLM 개발에는 위키피디아를 비롯해 AI Hub에 공개된 2억 어절의 헬스케어 질의응답 데이터, 20억 어절의 한국어 성능이 개선된 초거대 AI 말뭉치, 약 5000어절에 달하는 의료 및 법률 전문 서적의 말뭉치 등이 포함됐다.

MMLU 벤치 마크 중 의료 카테고리에 대해서 유니닥스 자체 테스트한 결과 기존 llama31_8b_instruct 모델 대비 벤치마크 점수가 상승했으며 문자열 생성 시 한글 및 의료용어 정확성이 증가함을 확인했다고 유니닥스는 전했다. 다만 공개된 데이터는 질병에 대한 이해를 돕기 위해 만들어진 것으로 질병의 정확한 진단과 치료방법을 보장하지 않으며, 정확한 증상에 대한 진단은 의사와 상담할 것을 명시하고 있다.

유니닥스는 2022년 9월 AI 사업본부를 설립한 이후 다양한 AI 프로젝트를 수행하고 있다. 전자문서 외에도 다양한 산업분야에서 과제를 진행해왔으며 유니닥스만의 학습 데이터 구축 및 AI 모델 개발 방법론을 제시하고 있다.

특히 NIA의 ‘초거대 AI 생태계 구축사업’에 참여 및 수행하고 있으며 시각장애인용 표데이터 음성변환 AI서비스 개발과, 치매 노인 사전진단을 위한 인공지능 모델 데이터 구축 등 다수의 의료분야 프로젝트를 완료 및 수행 중에 있으며, 자율주행 개발사업 등에도 참여하고 있다.

유석 유니닥스 AI사업본부장은 “이번 모델 공개는 유니닥스의 sLLM구축 역량을 보여주고 있다”며 “이번에 공개한 sLLM을 구축하면서 쌓은 경험과 지식은 법률, 금융, 교육 등 다양한 전문 분야에서 sLLM 구축으로 확장 가능하며, 산업별 특화 문서 기반 생성형 AI 시스템으로 확장할 수 있을 것으로 기대된다”고 밝혔다.

헬로티 이창현 기자 |

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.