IBM, 생성형 AI 구동 방식 개선하는 차세대 광학기술 발표

2024-12-10

데이터 센터 통신 대역폭 확장 및 GPU 유휴 시간 감소, AI 처리 속도 향상

IBM은 오늘 데이터 센터에서 생성형 AI 모델의 학습 및 실행 방식을 획기적으로 개선할 수 있는 차세대 광학 기술을 발표했다.

이는 기존의 전선 기반 단거리 통신을 보완하는 새로운 공동 패키지형 광학(co-packaged optics, 이하 CPO) 기술로, 데이터센터 내부 연결 속도를 빛의 속도로 대폭 향상시킬 수 있는 새로운 공정이다. 특히 IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(Polymer Optical Waveguide, PWG)을 성공적으로 설계, 조립해 최초로 공개했다. IBM 연구진은 CPO 기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.

광섬유 기술은 전기 대신 빛으로 장거리 데이터 전송을 빠르게 처리하기에, 현재 전 세계 상업 및 통신 트래픽 대부분에 사용되고 있다. 그러나 데이터 센터의 경우, 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 이 전선은 대규모 분산 학습 과정에서 다른 장치의 데이터를 기다리느라 절반 이상의 시간을 유휴 상태로 보내는 GPU 가속기들을 연결하고 있는데 이로 인해 상당한 비용과 에너지가 소모된다.

IBM 연구진은 광학 속도와 처리 능력을 데이터 센터 내부로 도입할 방법을 제시했다. IBM은 새롭게 발표된 논문을 통해, 고속 광학 연결을 가능하게 하는 새로운 CPO 모듈의 시제품을 소개했다. 이 기술은 데이터 센터 통신의 대역폭을 크게 확장하고, GPU의 유휴 시간을 줄이며, AI 처리 속도를 획기적으로 향상시킬 수 있다.

이번 연구 혁신으로 얻을 수 있는 주요 성과 중 하나는 중급 전기 배선 대비 전력 소비를 5배 이상 줄임으로써 생성형 AI 확장 비용을 낮추고, 데이터 센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있다는 점이다.

또한, CPO 기술을 통해 기존 전기 배선을 사용할 때보다 거대 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상의 폭이 커진다. AI 모델 학습 시, 모델 당 미국 가정 약 5000가구의 연간 전력 소비량에 해당하는 에너지를 절감함으로써 데이터센터 에너지 효율을 극대화할 수 있다.

IBM 리서치 연구 개발 총책임자 다리오 길(Dario Gil) 수석 부회장은 “생성형 AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터 센터는 진화해야 한다. 공동 패키지형 광학(CPO) 기술은 데이터 센터를 미래에 대비하도록 만들 수 있다”라며, “이 획기적인 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것이며, 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 말했다.

CPO 기술은 모듈 외 통신을 전기에서 광학 연결로 대체할 수 있는 가능성을 제공함으로써 AI의 증가하는 성능 요구를 충족하기 위한 새로운 경로를 제시한다. 이 기술은 최초의 2nm 노드 칩 기술, 7nm 및 5nm 공정 기술의 최초 구현, 나노시트 트랜지스터, 수직 트랜지스터(VTFET), 단일 셀 DRAM, 화학적 증폭 포토레지스트 등 IBM의 선도적 반도체 혁신 역사를 이어가고 있다.

헬로티 서재창 기자 |

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.