
AMD가 라데온 RX 9000 시리즈에 대해서 마침내 입을 열었다.
1월 초 개최된 CES에서는 최적화된 CU, 대폭 향상된 AI와 레이 트레이싱 기능, 미디어 인코딩 품질 개선이라는, 새로운 RNDA4 아키텍처 관련 내용은 뻔하다면 뻔한 자료가 미디어 대상으로 제공되었다.
AI 기술을 활용한 FSR 4, 생성형 이미지, 문서 요약, 챗 봇 같은 내용도 포함되어 있었지만 구체적인 내용은 알 수 없었는데, 1월 초 존재를 드러낸 이후 약 두 달 만에 라데온 RX 9000 시리즈의 근간을 이루는 RNDA4 아키텍처를 비롯해 CES에서는 존재만 확인되었던 것들의 세부 내용이 마침내 공개되었다.
보드나라에서는 AMD가 공개한 라데온 RX 9000 시리즈 관련 세부 내용들의 핵심 사항을 정리했다.
라데온 RX 9000 시리즈의 핵심, RDNA 4 아키텍처
라데온 RX 9000 시리즈의 근간을 이루는 RDNA4 아키텍처는 하이엔드 게이임 워크로드 최적화를 위해 래스터제이션과 컴퓨트 효율 개선, 레이 트레이싱에 대한 새로운 접근 방식, 포괄적인 고성능 ML 지원, 게이머와 크리에이터를 위한 멀티미지어 지원 개선을 목표로 개발되었다.
결과적으로 라데온 RX 6000 시리즈의 RDNA2 대비 래스터 성능은 약 두 배, 레이 트레이싱 성능은 약 2.4배, ML 성능은 최대 4배 개선되었으며, RDNA3 아키텍처와 비교시 래스터 성능은 약 35%, 레이 트레이싱 성능은 약 70%, ML 성능은 약 두 배 개선되었다.
이러한 성능 개선을 위해 RDNA4 아키텍처에는 3세대 레이 트레이싱 기술과 행렬 가속 기능을 개선하였고, 개시 시스템 최적화와 균등화, 업데이트된 인코딩과 디코딩 엔진이 포함된 새로운 듀얼 미디어 엔진을 채택했다.
경쟁사 대비 약점으로 지적받아온 레이트레이싱 성능 개선을 위해 RDNA4 아키텍처의 레이 가속기는 처리 성능이 두 배 증가해 박스별 8레이, 트라이앵글 유닛당 2레이 처리가 가능해졌으며, BVH 크기 감소를 위한 새로운 원시 노드 압축, 지향성 바운딩 박스, 셰이딩 개선 작업등이 이뤄졌다.
특히 레이 트레이싱 처리 과정에서 기존에는 축을 기준으로 처리하는 과정에서 발생하는 불필요한 바운딩 연산을 최소화할 수 있도록 진행 방향에 맞춰 바운딩 박스의 기준을 재조정하는 지향형 바운딩 박스가 도입되었다.
여기에 셰이딩 처리 과정에서 메모리 요구에 보다 유연하게 대응하도록 빈순하 메모리 기술을 추가, 작업 과정에서 불필요한 대기 시간 및 지연 시간을 줄여, 레이트레이싱 처리 뿐 아니라 다양한 워크로드에서 성능을 개선하는데 일조한다.
결과적으로 RDNA4 아키텍처의 CU는 동일 클럭과 대역폭에서 RDNA3 아키텍처 대 비 약 두 배의 광선 추적 성능을 구현하였다.
RDNA4에서는 동적 레지스터를 도입, 필요할 때 레지스터를 요청하고, 작업이 끝나면 반환하는 식으로 보다 유연하게 활용해 메모리 레이턴시와 전체적인 세이더 코어의 효율을 끌어올린 것도 주요 특징 중 하나다.
RDNA4 아키텍처의 AI 가속기는 최근 추세를 반영해 WMMA(Wave Matrix Multiply Accumulate)를 강화, 행렬 연산을 긴밀하게 재조정하고, 보다 효율적인 작업이 가능하도록 지원 데이터 유형도 확대했다.
이에 따라 RDNA4 아키텍처에서는 FP8과 BF8 추가, F32와 F64를 제외한 데이터에 대해서는 처리 능력이 최대 8배 증가했으며, SDXL 1.5 기준 CU당 FP16 처리 능력을 두 배로 끌어 올렸다.
RDNA4 아키텍처와 함께 개선된 게이밍 환경, FSR4와 AFMF 2.1
RDNA4 아키텍처로 개선된 라데온 RX 9000 시리즈로 보다 나은 게이밍 환경을 체험할 수 있도록 플랫폼도 업데이트 되었다.
대표적인 것이 지난해부터 알려진 AI 기반 업스케일링 기술인 FSR4로, 기본적인 구동 방식에 큰 차이는 없지만, AMD 인스팅트로 훈련된 게임 ML 모델을 FSR4 AI 알고리즘으로 처리하며, 마이크로소프트에서 준비 중인 뉴럴 랜더링에도 대응한다.
FSR4는 라데온 RX 9000 시리즈 런칭 시점에서 30여 개의 타이틀이 지원 업데이트될 예정이며, 2025년 중으로 75개 이상의 타이틀이 지원을 약속한 상황이다.
아쉽지만 FSR4는 RDNA4 아키텍처, 즉 라데온 RX 9000 시리즈만을 지원한다. RDNA4 아키텍처 AI 가속기에 추가된 신규 데이터 유형을 활용하기 때문으로 추정된다.
드라이버 차원의 프레임 생성 기술인 AFMF(AMD Fluid Motion Frames)도 2.1 버전으로 업그레이드된다.
각 게임에 최적화되었다고 보기 어려운, 드라이버 차원의 프레임 생성 기술인 만큼 품질에 대한 아쉬움을 토로하는 경우도 있었는데, AFMF 2.1은 이미지 자체의 품질 개선과 함께 자막, UI 등의 오버레이 관리, 고스팅 개선 등의 사용자 경험 개선을 이뤘다.
라데온 RX 9000 시리즈와 함께 발표되었지만, RX 9000 시리즈외에도 RX 7000 및 RX 6000 시리즈, 라이젠 AI 300 시리즈도 지원하는 범용성이 유지된다.
RIS 기능이 업그레이드된 RIS2도 발표되었다. 게임과 영상을 포함해 전체 데스크탑 작업에 적용할 수 있고, 특정 앱과 API에 종속되지 않고 사용할 수 있다. 기존 버전에 비해 더 나은 전성비를 제공하는 것도 특징이다.
앞서 짧게 언급했지만, RDNA4 아키텍처에 개선된 미디어 엔진은 이미지 품질과 성능 개선된 것이 특징이다.
AMD의 발표에 따르면 HEVC와 AV1 코덱은 최대 8K 75FPS를 지원하고, H.264 저 레이턴시 인코드 품질과 HEVC 인코드 품질은 각각 25%와 11% 개선되었다. 720p 인코드 성능은 최대 30%, AV1과 VP9 성능은 최대 50% 개선되었다.
프리싱크 전력 최적화로 듀얼 모니터 구성시 아이들 전력 개선, 하드웨어 플립 큐 지원으로 영상 프레임 스케쥴링을 GPU로 처리해 CPU 이용율을 낮춘 것도 RDNA4 아키텍처의 특징으로 꼽을 수 있다.
AMD 소프트웨어 아드레날린 에디션(ASAE), AI를 품다
AI 성능이 업데이트된 라데온 RX 9000 시리즈 출시와 함께, AMD는 드라이버 소프트웨어인 ASAE 25.3.1 버전에 AI를 통합한다.
AMD 챗이라는 이름으로 챗봇을 탑재해 이미지 생성, 사용자와의 일반적인 Q&A나 시스템 설정 문의 등을 로컬 GPU로 처리할 수 있다. 개인정보 유출에 대한 걱정없이 AI의 편리함을 사용할 수 있다.
런칭 시점에서 지원 언어는 영어와 중국어 간체를 지원하며, 온디바이스 AI 기능인 AMD CHAT외에 서드파티 AI 앱 설치, PC 상태 최적화를 위한 AMD 드라이버 설치 매니저도 통합된다.
한편, AI를 활용해 화면 품질을 주기적으로 분석하는 과정에서 이상 발생시, 관련 정보를 AMD와 공유해 품질 개선을 위해 활용하는 'AMD IMAGE INSPECTOR'도 추가된다.
'AMD 사용자 경험 프로그램'의 일환으로 통합된 AMD IMAGE INSPECTOR는 드라이버의 게임 리스트에 포함된 게임 실행 시 화면을 주기적으로 평가해 문제 발생시 AMD와 자료를 공유해 드라이버와 라데온 품질 개선에 활용한다.
개인정보 유출에 대한 우려가 큰 요즘, 해당 기능의 화면 평가는 개인 정보가 포함될 수 있는 그래픽이 아닌 수치로 평가하고, 게임을 전체화면이나 경계선없는 전체화면으로 실행할 때만 동작한다.
또한 드라이버 설치 단계에서 해당 기능의 활성화 여부를 묻고, 활성화한 경우에도 문제가된 화면 정보는 사용자의 최종 승인을 거치기 전까지 사용자의 시스템 외부로 전송되지 않는다는 것이 AMD의 설명이다.
'AMD 사용자 경험 프로그램'의 일환으로 구동되는 만큼, 드라이버 설치 단계에서 활성화했어도 마음이 바뀌면 언제든 비활성화할 수 있고, 이후에도 활성화할 수 있다.
라데온 RX 9070 시리즈, QHD 가격에 4K 성능을
AMD는 RDNA4 아키텍처를 활용한 라데온 RX 9070 시리즈를 발표하며, QHD 가격에 4K 성능을 표방하고 있다.
새로운 네이밍 규격상 이들 제품군은 지포스 RTX 4070 시리즈에 대응하며, 아직 정확한 가격은 발표되지 않았지만 해외 쇼핑몰 등록 상황과 AMD의 캐치프래이즈를 감안하면 이들과 비슷한 가격대에 포진할 것으로 예상된다.
AMD에서 발표한 성능 지표에 따르면 4K Max 세팅 기준 라데온 RX 9070 XT는 라데온 RX 6900 XT 대비 51%, RTX 3090 대비 26% 높은 성능을 내주고, 라데온 RX 9070은 RX 6800 XT 대비 38%, RTX 3080 대비 26% 높은 성능을 발휘한다.