엔비디아가 엔비디아 코스모스(NVIDIA Cosmos)를 7일 발표했다. 이는 최첨단 생성형 월드 파운데이션 모델(World Foundation Model, WFM), 고급 토크나이저, 가드레일, 가속화된 비디오 처리 파이프라인으로 구성된 플랫폼으로 자율주행 차량(AV), 로봇과 같은 물리 AI 시스템의 개발을 촉진한다.
물리 AI 모델은 개발 비용이 많이 들고 방대한 양의 실제 데이터와 테스트가 필요하다. 코스모스 WFM은 개발자가 기존 모델을 훈련하고 평가할 수 있는 방대한 양의 사실적인 물리 기반 합성 데이터를 손쉽게 생성할 수 있는 방법을 제공한다. 아울러 개발자는 코스모스 WFM을 미세 조정해 맞춤형 모델을 구축할 수도 있다.
코스모스 모델은 로보틱스와 AV 커뮤니티의 작업을 가속화하기 위해 오픈 모델 라이선스로 제공될 예정이다. 개발자는 엔비디아 API 카탈로그에서 첫 번째 모델을 미리 보거나, 엔비디아 NGC 카탈로그 또는 허깅페이스(Hugging Face)에서 모델 제품군과 미세 조정 프레임워크를 다운로드할 수 있다.
젠슨 황 엔비디아 창립자 겸 CEO는 “로보틱스를 위한 챗GPT(ChatGPT)의 순간이 다가오고 있다”며 “거대 언어 모델(large language model, LLM)과 마찬가지로 WFM은 로봇과 AV 개발을 발전시키는 데 필수적”이라고 강조했다.
그는 이어 “그러나 모든 개발자가 자체적으로 훈련할 수 있는 전문 지식과 리소스를 갖추고 있는 것은 아니다”라며 “우리는 물리 AI를 대중화하고 모든 개발자가 일반 로보틱스를 활용할 수 있도록 하기 위해 코스모스를 만들었다”고 말했다.
헬로티 이창현 기자 |