IBM, VLM 포함된 기업용 거대언어모델 '그래니트 3.2' 발표

비전 언어 모델(VLM) 포함 및 연쇄적 사고 기능 추가돼

IBM이 기업용 거대 언어 모델(LLM) '그래니트(Granite) 3.2'를 출시했다.

이번 버전은 기존 모델 대비 크기를 줄이면서도 성능을 유지하는 데 초점을 맞췄다. IBM은 이를 통해 기업들이 AI를 효율적으로 활용하도록 지원한다는 방침이다.

그래니트 3.2 모델은 아파치 2.0 라이선스 하에 허깅 페이스에서 제공되며, IBM 왓슨x.ai, 올라마, 리플리케이트, LM 스튜디오 등 다양한 플랫폼에서 즉시 활용 가능하다. 또한, 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 곧 제공될 예정이다.

주요 기능으로는 문서 해석 작업을 지원하는 비전 언어 모델(VLM)이 포함됐다. 해당 모델은 DocVQA, ChartQA, AI2D, OCRBench 등의 벤치마크에서 기존 대형 모델과 유사한 성능을 보였으며, IBM은 8500만 개의 PDF를 처리하고 2600만 개의 질문-답변 데이터를 생성하는 오픈소스 도구 '도클링'을 활용해 성능을 강화했다.

추론 성능 향상을 위한 ‘연쇄적 사고’ 기능도 추가됐다. 이를 통해 8B 모델은 아레나하드, 알파카이벨과 같은 벤치마크에서 두 자릿수 이상의 성능 향상을 보였다. 또한, 새로운 추론 확장 기법을 적용해 수학 추론 벤치마크(AIME2024, MATH500)에서 기존 대형 모델과 유사한 성능을 낼 수 있도록 조정할 수 있다.

보안 모델 역시 개선됐다. 기존 그래니트 3.1 가디언 모델을 기반으로 크기를 30% 줄이면서도 성능을 유지하는 '그래니트 가디언(Granite Guardian)' 모델이 도입됐다. 여기에 신뢰도 평가 기능이 추가돼 위험 평가의 정밀도를 높였다. 이와 함께 IBM은 장기 예측을 지원하는 '타이니타임믹서(TinyTimeMixers, TTM)' 모델을 함께 공개했다. 이 모델은 금융 및 경제 동향 분석, 공급망 수요 예측, 유통업계의 계절별 재고 관리 등 장기적인 트렌드 분석에 활용될 수 있다.

IBM AI 연구 담당 스리람 라가반(Sriram Raghavan) 부사장은 “기업이 과도한 컴퓨팅 비용 없이 효율적으로 AI를 활용하는 것이 중요하다”며 “IBM의 최신 그래니트 모델은 AI의 접근성과 비용 효율성을 높이는 데 기여할 것”이라고 밝혔다.

헬로티 서재창 기자 |