AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 최근 발표한 세계에서 가장 강력한 슈퍼컴퓨터 톱500(TOP500) 리스트 중 384개의 시스템이 엔비디아(NVIDIA) 기술로 구동된다고 밝혔다.
2006년 쿠다(CUDA)의 출시를 시작으로 엔비디아는 AI와 가속 컴퓨팅 분야에서 발전을 주도해 왔다. 최근 발표된 세계에서 가장 강력한 슈퍼컴퓨터 톱500 리스트는 엔비디아의 성과가 정점에 달했음을 보여준다.
올해 톱500 리스트에 포함된 384개의 시스템이 엔비디아 기술로 구동된다. 새롭게 리스트에 오른 53개 시스템 중 87%인 46개는 가속화된 시스템이다. 가속화된 시스템 중 85%는 엔비디아 호퍼(Hopper) GPU를 사용해 기후 예측, 신약 개발, 양자 시뮬레이션과 같은 분야의 발전을 주도하고 있다.
가속 컴퓨팅은 초당 부동소수점 연산인 플롭스(floating point operations per second, FLOPS) 그 이상의 의미를 가진다. 이를 위해서 풀스택, 애플리케이션별 최적화가 필요하다. 이번 주 슈퍼컴퓨팅 2024(Supercomputing 2024, SC24)에서 엔비디아는 cu파이뉴메릭(cuPyNumeric)의 출시를 발표했다. 이는 5백만 명 이상의 개발자가 파이썬(Python) 코드를 수정하지 않고도 강력한 컴퓨팅 클러스터로 원활하게 확장할 수 있는 엔비디아 쿠다-X 라이브러리이다.
또한, 엔비디아는 엔비디아 쿠다-Q 개발 플랫폼에 대한 주요 업데이트를 공개했다. 이 플랫폼은 양자 연구자들이 이전에는 계산적으로 불가능하다고 여겨졌던 규모의 양자 장치를 시뮬레이션할 수 있도록 지원한다.
아울러 엔비디아는 HPC와이어(HPCwire)의 리더스와 에디터스 초이스 어워드(Readers’ and Editors’ Choice awards)의 거의 12개에 가까운 다양한 부문에서 수상하며 20년 연속 수상의 영예를 안았다.
혼합 정밀도와 AI로 여는 새로운 과학적 발견의 시대
혼합 정밀도 부동 소수점 연산과 AI는 현대 과학의 복잡함에 직면한 연구자들이 선택하는 도구가 됐다. 이는 기존 방식보다 더 빠르고 효율적이며 적응력이 뛰어나면서도 정확도는 그대로 유지한다.
이러한 변화는 단순히 이론적인 것에 그치지 않고 이미 일어나고 있다. SC24에서 고든 벨(Gordon Bell) 최종 후보에 오른 두 개의 프로젝트는 AI와 혼합 정밀도를 사용해 유전체학과 단백질 설계를 발전시킨 방법을 공개했다.
킹 압둘라 과학기술대학교(King Abdullah University of Science and Technology)의 데이비드 케예스(David Keyes) 교수는 ‘유전체학을 위한 혼합 정밀도 사용(Using Mixed Precision for Genomics)’이라는 제목의 논문에서 0.8 엑사플롭스의 혼합 정밀도를 사용해 유전체와 일반화된 유전형 사이의 관계를 탐색했다. 또한 이들이 영향을 받는 질병의 유병률에 대해 연구했다.
마찬가지로 아르곤 국립연구소(Argonne National Laboratory)의 계산 생물학자 아르빈드 라마나단(Arvind Ramanathan)은 단백질 설계 속도를 높이기 위해 엔비디아 그레이스(Grace) 호퍼 기반 알프스(Alps) 시스템에서 3 엑사플롭스의 AI 성능을 활용해 단백질 설계 속도를 높였다.
연구자들은 제약 애플리케이션을 위해 특별히 설계된 강력한 도구인 엔비디아 바이오네모(BioNeMo)를 사용해 AI 기반 신약 개발과 생명을 구하는 치료법 개발을 더욱 발전시킬 수 있다. 현재 오픈 소스로 제공되는 바이오네모 프레임워크(Framework)는 신약 개발과 분자 설계를 위한 AI 모델 생성, 맞춤화, 배포를 가속화할 수 있다.
톱500 전반에 걸쳐 AI와 혼합 정밀도 부동 소수점 연산의 광범위한 사용은 컴퓨팅 우선 순위에 대한 세계적인 변화를 반영한다. 이제 톱500 시스템에서 총 249 엑사플롭스의 AI 성능이 제공되고, 이를 통해 산업 전반의 혁신과 발견을 가속화할 수 있게 됐다.
톱500 리스트 중 엔비디아 가속 시스템은 AI와 혼합 정밀도 시스템 성능과 같은 주요 지표에서 탁월한 성능을 발휘한다. 190 엑사플롭스 이상의 AI 성능과 17 엑사플롭스의 단일 정밀도(FP32)를 갖춘 엔비디아의 가속 컴퓨팅 플랫폼은 과학 컴퓨팅의 새로운 엔진으로 자리잡고 있다. 또한, 엔비디아는 여전히 이중 정밀도(FP64)가 필요한 특정 과학 계산을 위해 4 엑사플롭스의 이중 정밀도 성능도 제공하고 있다.
가속화된 컴퓨팅은 지속 가능한 컴퓨팅
컴퓨팅 용량에 대한 수요가 증가함에 따라 지속 가능성에 대한 필요성도 커지고 있다.
세계에서 가장 에너지 효율이 높은 슈퍼컴퓨터를 선정하는 그린500(Green500)에서 엔비디아 가속 컴퓨팅이 탑재된 시스템은 상위 10개 중 8개에 속한다. 예를 들어, 유로HPC/FZJ(EuroHPC/FZJ)의 JEDI 시스템은 와트당 72.7 기가플롭스라는 놀라운 성능을 달성해 성능과 지속 가능성이 일치할 때 가능해지는 벤치마크를 설정했다.
기후 예측을 위해 엔비디아는 SC24에서 엔비디아 어스-2(Earth-2)를 위한 두 가지 새로운 엔비디아 NIM 마이크로서비스를 발표했다. 엔비디아 어스-2는 날씨와 기후 조건을 시뮬레이션하고 시각화하는 디지털 트윈 플랫폼이다. 코디프(CorrDiff) NIM과 포캐스트넷(FourCastNet) NIM 마이크로서비스는 기후 변화 모델링과 시뮬레이션 결과를 최대 500배까지 가속화할 수 있다.
환경에 미치는 영향에 대한 의식이 점점 더 커지고 있는 가운데, 엔비디아 가속 컴퓨팅 혁신은 고성능과 에너지 효율성의 균형을 유지해 더 밝고 지속 가능한 미래를 실현하는 데 도움을 준다.