엔비디아, 힌디어용 sLM 네모트론-4-미니-힌디-4B 공개

엔비디아가 힌디어를 위한 소형 언어 모델(small Language Model, sLM)인 네모트론-4-미니-힌디-4B(Nemotron-4-Mini-Hindi-4B)를 출시해 인도에서 맞춤형 언어 모델을 구축하고 있다고 밝혔다.

나마스테(Namaste), 바나캄(vanakkam), 삿 스리 아칼(sat sri akaal) 이 인사말들은 헌법에서 인정된 22개 언어와 인구조사에 기록된 1,500개 이상의 언어를 가진 인도에서 사용하는 3가지 인사말에 불과하다. 인도의 인구 약 10%는 인터넷에서 가장 많이 사용되는 언어인 영어를 사용한다.

세계에서 가장 인구가 많은 국가인 인도는 급속한 디지털화에 앞장서고 있다. 또한, 인도 기업과 현지 스타트업은 더 많은 인도인이 모국어로 기술과 상호작용할 수 있도록 다국어 AI 모델을 개발하고 있다. 이는 현지 데이터 세트를 기반으로 구축되고 지역의 특정 방언, 문화, 관행을 반영하는 국내 AI 인프라를 개발하는 소버린 AI의 사례다.

이러한 프로젝트들은 인도어와 영어를 위한 언어 모델을 구축해 기업용 고객 서비스 AI 에이전트를 강화한다. 아울러 콘텐츠를 신속하게 번역해 정보에 대한 접근성을 넓히고, 14억 명이 넘는 다양한 사람들에게 보다 쉽게 서비스를 제공할 수 있도록 지원하고 있다.

엔비디아(NVIDIA)는 이러한 이니셔티브를 지원하기 위해 인도에서 가장 보편적이며 5억 명 이상이 사용하고 있는 힌디어를 위한 sLM인 네모트론-4-미니-힌디-4B를 출시했다. 현재 엔비디아 NIM 마이크로서비스로 제공되는 이 모델은 모든 엔비디아 GPU 가속 시스템에 쉽게 배포돼 성능을 최적화할 수 있다.

인도의 IT 서비스와 컨설팅 회사인 테크 마힌드라(Tech Mahindra)는 힌디어와 수십 개의 방언에 초점을 맞춘 인더스 2.0(Indus 2.0)이라는 AI 모델을 개발하기 위해 네모트론 힌디 NIM 마이크로서비스를 최초로 사용했다. 인더스 2.0은 테크 마힌드라의 고품질 미세 조정 데이터를 활용해 모델 정확도를 높임으로써 은행, 교육, 의료, 기타 산업 분야의 고객이 현지화된 서비스를 제공할 수 있는 기회를 열어준다.

테크 마힌드라는 지난 10월 23일부터 25일까지 뭄바이에서 진행된 엔비디아 AI 서밋(AI Summit)에서 인더스 2.0을 선보였다. 아울러 회사는 자체 소버린 거대 언어 모델(Large Language Model, LLM) 플랫폼인 테노(TeNo)를 개발하는 데 엔비디아 네모(NeMo)를 사용한다.

네모트론 힌디 모델은 40억 개의 파라미터를 가지고 있으며, 엔비디아에서 개발한 150억 개의 파라미터를 가진 다국어 언어 모델인 네모트론-4 15B에서 파생됐다. 이 모델은 생성형 AI 개발을 위한 엔드투엔드 클라우드 네이티브 프레임워크이자 마이크로서비스 제품군인 엔비디아 네모를 사용했다. 이를 통해 실제 힌디어 데이터, 합성 힌디어 데이터와 동일한 양의 영어 데이터를 조합해 정제와 추출, 훈련을 수행했다.

이 데이터 세트는 고품질 멀티모달 데이터를 대규모로 처리해 훈련과 사용자 정의에 활용해 생성형 AI 모델의 정확도를 향상시키는 엔비디아 네모 큐레이터(NeMo Curator)로 제작됐다. 네모 큐레이터는 멀티노드 GPU 시스템에서 데이터 처리 파이프라인을 가속화해 처리 시간과 총소유비용을 낮추기 위해 엔비디아 래피즈(RAPIDS) 라이브러리를 사용한다. 아울러 고품질 데이터를 처리하기 위해 합성 데이터 생성, 데이터 필터링, 분류, 중복 제거를 위한 사전 구축된 파이프라인과 빌딩 블록을 제공한다.

네모로 미세 조정한 최종 모델은 최대 80억 개의 파라미터를 가진 AI 모델에 대한 여러 정확도 벤치마크에서 우수한 성능을 보이고 있다. 이는 NIM 마이크로서비스로 패키징돼 교육, 소매, 의료 등 다양한 산업 분야의 사용 사례를 지원하는 데 쉽게 활용될 수 있다.

또한, 이 모델은 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일환으로 제공된다. 이를 통해 기업은 AI 개발을 프로덕션 환경에 맞춰 간소화할 수 있는 기술과 기업 수준의 보안을 비롯한 추가 리소스에 접근할 수 있다.

인도 전역의 혁신가, 주요 기업, 글로벌 시스템 통합업체는 엔비디아 네모를 사용해 맞춤형 언어 모델을 구축하고 있다.

첨단 스타트업을 위한 엔비디아 인셉션(Inception) 프로그램에 참여한 기업들은 여러 인도 언어에 대한 AI 모델을 개발하는 데 네모를 사용하고 있다.

사르밤 AI(Sarvam AI)는 기업 고객에게 음성 대 텍스트, 텍스트 대 음성 변환, 번역과 데이터 구문 분석 모델을 제공한다. 이 회사는 인도 최초의 자체 개발 다국어 LLM인 사르밤 1을 개발했으며, 이 모델은 엔비디아 H100 텐서 코어(Tensor Core) GPU로 구동되는 현지 AI 인프라에서 처음부터 훈련됐다.

네모 큐레이터와 네모 프레임워크 등 엔비디아 AI 엔터프라이즈 소프트웨어를 사용해 개발된 사르밤 1은 영어와 벵골어, 마라티어, 타밀어, 텔루구어 등 인도 주요 10개 언어를 지원한다.

또한 사르밤 AI는 엔비디아 NIM 마이크로서비스, 대화형 AI를 위한 엔비디아 리바(Riva), 엔비디아 텐서RT-LLM 소프트웨어, 엔비디아 트리톤 추론 서버(Triton Inference Server)를 사용해 1초 미만의 지연 시간으로 대화형 AI 에이전트를 최적화하고 배포한다.

또 다른 인셉션 스타트업인 지나니닷에이아이(Gnani.ai)는 다국어 음성 변환 LLM을 구축했다. 이 모델은 인도와 미국 전역의 150개 이상의 은행, 보험, 금융 서비스 회사에서 매일 약 천만 건의 실시간 음성 상호작용을 처리하는 AI 고객 서비스 비서를 지원한다. 이는 14개 언어를 지원하며 엔비디아 호퍼(Hopper) GPU와 네모 프레임워크를 사용해 1,400만 시간 이상의 대화 음성 데이터를 기반으로 훈련됐다.

지나니닷에이아이는 가상 고객 서비스 비서와 음성 분석을 위한 AI를 최적화하기 위해 텐서RT-LLM, 트리톤 추론 서버, 리바 NIM 마이크로서비스를 사용한다.

또한, 위프로와 TCS는 네모 큐레이터의 합성 데이터 생성 파이프라인을 사용해 영어 이외의 언어로 데이터를 생성해 고객을 위한 LLM을 맞춤화한다.