
엔비디아가 로봇과 자율주행 차량용 인공지능(AI) 모델 개발에 필요한 ‘개방형 물리 AI 데이터세트’를 20일(현지시각) 무료로 공개했다.
데이터세트는 AI 모델 훈련 전반에 사용되는 데이터 모음이다. 스스로 움직이는 로봇이나 자율주행 차량에 탑재할 AI를 개발하려면 먼저 외부 환경에 대응하는 방법을 가르쳐야 한다. 데이터세트는 이럴 때 사용한다. 로봇이나 차량이 맞닥뜨릴 수 있는 다양한 상황에 어떻게 대응할지 알려주는 교과서라고 볼 수 있다.
물리 AI 데이터세트는 현실 세계에서 일어날 수 있는 수많은 상황을 정확하게 구현해야 한다. 엔비디아에 따르면, 로봇 AI 모델을 훈련하려면 수천 시간 길이의 동영상이 필요하고, 자율주행 AI 모델을 개발하려면 수만 시간 분량의 주행 데이터를 학습해야 한다. 이런 데이터를 엔비디아가 제공한다는 것이다.
엔비디아는 “(데이터세트를 제공함으로써) 연구원이나 개발자가 로봇과 자율주행 차량을 처음부터 개발하기 어려운 현실적 상황에서 프로젝트를 추진하는 데 큰 도움이 될 것”이라고 설명했다.
회사는 사전 훈련, 테스트, 검증뿐만 아니라 사후 훈련 과정에서 특성 사례에 대응하는 성능을 개선할 때도 데이터세트를 사용할 수 있다고 소개했다.
엔비디아는 물리 AI 데이터세트 초기 버전을 오픈소스 커뮤니티 허깅 페이스에 공개했다. 이중 로봇 교육에 사용하는 데이터는 15TB 분량에 달한다. 여기에는 엔비디아 클라우드 애플리케이션 에셋 ‘심레디’를 비롯해 1000여개에 달하는 오픈USD 에셋이 들어있다.
엔비디아는 자율주행 차량 개발용 데이터도 곧 제공하겠다고 밝혔다. 여기에는 미국 내 1000개 이상의 도시와 유럽 24개국에서 수집한 다양한 교통 시나리오 영상이 포함된다. 또한 자사에서 물리 AI를 교육·테스트·검증할 때 사용하는 데이터도 추가할 예정이라고 덧붙였다.
회사는 창고용 물류 로봇, 수술 보조 로봇, 건설 현장처럼 복잡한 환경에서 운행하는 자율주행 차량 등 다양한 AI 모델 개발에 데이터세트를 적용할 수 있다고 소개했다. 또한 캘리포니아대학교 버클리의 버클리 딥드라이브 센터, 카네기멜론대학교의 세이프AI 연구소, 캘리포니아대학교 샌디에이고의 컨텍스츄얼 로보틱스 연구소에서 자사 데이터세트를 조기 채택했다고 덧붙였다.
글. 바이라인네트워크
<이병찬 기자>bqudcks@byline.network