로봇 시뮬레이션 시 현실보다 43만배 빠른 습득
카네기멜론대학과 산업계 연구진이 개발한 생성형 인공지능(AI) 기반 물리 시뮬레이션 플랫폼이 오픈소스로 공개됐다.
20일 카네기멜론대학교 박사과정의 저우 시안이 이끄는 연구자그룹은 로봇 시뮬레이션을 현실보다 43만배 빠르게 수행할 수 있는 물리 시뮬레이션 엔진 ‘제네시스(Genesis)’를 공개했다.
제네시스는 로봇 공학과 물리 AI 애플리케이션을 위해 설계된 물리 시뮬레이션 플랫폼이다. 범용 물리 엔진으로 광범위한 소재와 물리적 현상을 시뮬레이션할 수 있다.
프론트엔드 인터페이스와 백엔드 물리엔진 모두 파이썬으로 개발됐다. 설치하기 간단하고 사용자 친화적인 API를 제공한다.
제네시스는 기존 GPU 가속 로봇 시뮬레이터보다 최대 10~80배 빠른 시뮬레이션 속도를 제공한다. 시뮬레이션 정확도도 매우 높다고 한다. 다양한 최첨단 물리 솔버(physics solvers)를 지원하는 통합 프레임워크로 광범위한 재료와 물리적 현상을 모델링한다.
제네시스는 로봇 공학의 물리적 테스트와 훈련에 소요되는 시간과 비용을 대폭 줄여준다. 대규모 병렬 행렬 연산을 통해 수많은 시뮬레이션 작업을 동시에 수행한다.
제네시스 엔진은 자연어 프롬프트로 3D 물리 시뮬레이션을 생성할 수 있다.
연구진이 ‘4D 동적 세계‘로 부르는 가상현실을 생성하는 이 기능은 시간의 흐름에 따라 움직이는 3D 세계를 만들어준다. 시각언어모델(VLM)을 사용해 텍스트 프롬프트로 완전한 가상 환경을 생성하고, 제네시스 시뮬레이션 API를 사용해 세계를 만들어낸다. 텍스트 명령에서 얻은 현실적인 물리, 카메라 움직임, 객체 동작 등을 모두 포함한다. 프로그래밍 대신 자연어로 로봇 테스트 환경을 만들 수 있게 된다.
캐릭터 동작, 대화형 3D 화면, 얼굴 애니메이션 등을 생성할 수 있다. 일반적인 비디오 생성 모델처럼 픽셀의 통계적 모양으로 형체를 만드는 대신, 물리적 시뮬레이션으로 세계를 구성하므로 더욱 사실적인 3D 영상을 만들어낸다.
기본 물리엔진과 시뮬레이션 플랫폼이 먼저 오픈소스로 공유됐고, 생성 프레임워크는 추후 출시될 예정이다.
제네시스 논문 공동저자인 짐 팬은 X에서 “단일 GPU로 로봇이 1시간 만에 10년 치 훈련 경험을 얻을 수 있다”며 “네오가 매트릭스에서 눈깜짝할 사이에 무술을 배운 방법”이라고 설명했다.
글. 바이라인네트워크
<김우용 기자>yong2@byline.network