2022년 10월 지포스 RTX 40 시리즈의 런칭 이후 약 2년 3개월, 횟수로 3년째에 접어든 시점에서 블랙웰 아키텍처의 지포스 RTX 50 시리즈 런칭을 앞두고 엔비디아 코리아에서 관련 내용을 알리기 위한 '엔비디아 RTX AI PC 데이' 행사를 진행, 행사서 어떤 내용이 공개되었는지 정리했다.
AI 시대 뉴럴 렌더링을 위한 블랙웰 아키텍처
이번 행사는 CES 2025 에디터스 데이에서 공개된 지포스 RTX 50 시리즈의 블랙웰 아키텍처와 핵심 내용을들 재확인하는 자리였다. 행사에는 엔비디아 APAC 테크 마케팅 디렉터인 제프 옌(Jeff Yen)과 엔비디아 지포스, 테크 마케팅 디렉터인 션 클리블랜드(Sean Cleveland)이 연사로 자리를 함께했다.
RTX 50 시리즈의 핵심 요소는 지난 CES에서 발표된 내용이 정리된 기사를 참고하기 바라며, 이번에는 당시 다루지 않았던 아키텍처 관련 내용을 위주로 정리했다.
블랙웰 아키텍처의SM은 AI 처리에 적합하도록, 기존에 FP32와 INT32 동시 처리 가능한 셰이더 코어, 일반 게임 연산에 최적화된 FP32 전용 코어를 모두 FP32와 INT32 처리가 가능한 코어로 전환했다.
또한 기존에 셰이더 코어와 텐서 코어를 별도 제어하던 셰이더가 텐서 코어까지 동시 관여하도록 개선된 '뉴럴 셰이더'로 변경하고, 이에 맞춰 워크로드가 적절한 코어에 할당해 작업 효율을 높이는 SER(Shader Execution Reordering)도 개선되었다.
RT 코어도 기존 트라이앵글 인터섹션 엔진을 새로운 트라이앵글 클러스터 인터섹션/ 디컴프래션 엔진과 리니어 스웹 스피어(Liner Swept Spheres)로 변경, 레이 트라이앵글 인터섹션 성능을 두 배나 높이고, 메모리 요구량도 25% 줄이며, 머리카락과 털을 보다 자연스럽게 처리할 수 있게 되었다.
블랙웰 아키텍처의 텐서 코어는 FP4 연산을 지원해 전 세대 대비 스루풋을 두 배 높였다.
블랙웰 아키텍처는 텐서 코어의 FP4 연산 지원과 셰이더 코어의 INT32 지원 등을 통한 AI 연산 및 뉴럴 랜더링 등의 새로운 기능을 강조하고 있는데, 이렇게 복잡한 워크로드 상태를 정확히 제어하기 위한 AI 관리 프로세서(AMP)도 추가되었다.
이를 통해 LLM 처리와 DLSS 4 프레임 생성, 디스플레이 주사율 등을 어긋남없이 쾌적한 게임 환경을 제공할 수 있게 되었다.
블랙웰은 전력 최적화를 위한 설계에도 힘을 쏟았다. DLSS4를 비롯해 bit당 전력 효율이 높은 GDDR7, 클럭/ 전력/ 레일로 세분화된 파워 게이팅, 클럭에 따라 1천배나 빨라진 스위칭 기술, 기존에는 프레임 생성 과정에서 클럭을 고정시켜야 했지만, 블랙웰에서는 전압과 클럭을 변환하는 과정에서도 프레임 생성이 가능해져 전력 절감 효과를 향상 시켰다.
게이머와 크리에이터를 위한 AI
블랙웰 아키텍처는 셰이더의 INT32 지원 강화, 텐서 코어의 INT4 지원 등, 전반적으로 AI 지원을 전면에 내세우고 있다. 따라서 CES에서는 물론이고, 이번 '엔비디아 RTX AI PC 데이'에서도 블랙웰로 가능한 AI 기능에 대한 내용이 강조되었다.
대표적으로 엔비디아 ACE 기반의 자동화된 게임 캐릭터와 AI NPC 구현을 지원하며, 배틀그라운드와 미르5, inZOI 등의 게임에 지원될 예정이다.
또한, 쉬운 생성형 AI 활용을 위해 최적화된 마이크로서비스 패키지인 'NVIDIA NIM for RTX'도 공개되었으며, 이를 활용한 서비스의 예시로 PDF 파일을 이용해 팟캐스트를 구현하는 'PDF to Podcast'가 소개되었다.
갈수록 AI 모델에 요구되는 VRAM이 증가하는 현실이지만, 물리적으로 VRAM을 확장하기에는 한계가 있고, 블랙웰은 이런 상황에 대한 해법으로 FP4 지원을 소개했다. RTX 4090과 비교해 동급의 생성형 AI 이미지 처리 작업에 RTX 5090은 약 절반의 VRAM으로 두 배 이상 빠르게 작업을 완료할 수 있었다.
RTX 50 시리즈는 전문가들을 위해 보다 세밀하고 풍부한 색을 지원하는 4:2:2 색정보의 디코드와 인코드 지원해 기존 CPU를 이용할 때에 비해 열 배 이상 빠르게 처리할 수 있으며, 최대 세 개의 인코더가 탑재되어 기존 방식에서도 작업 시간을 대폭 개선할 수 있다.
엔비디아 브로드 캐스트는 기존의 노이즈 캔슬링에 더해 전문 스튜디오급 음성, 충분하지 못한 조명 환경에서 스트리머의 얼굴을 부각 시켜주는 가상 키 라이트, 기존의 가상 백그라운드와 노이즈 캔슬링, 아이 컨택트 기능, UI 개선 등이 이뤄진다.