인텔, HBM2E 탑재 AI 가속기 '가우디3' 사용 첫 엔터프라이즈급 AI 솔루션 출시

2024-10-08

[FETV=양대규 기자] 인텔이 HBM2E를 탑재한 AI 가속기인 '가우디3'를 이용한 최초의 엔터프라이즈급 AI 솔루션을 출시한다.

인텔은 인플렉션 AI(Inflection AI)와 기업과 개발자를 위한 AI 도입 및 영향력을 가속화하기 위해 협력한다고 8일 밝혔다.

인플렉션 AI는 인텔 가우디3와 인텔 타이버 AI 클라우드를 기반으로 한 업계 최초의 엔터프라이즈급 AI 시스템인 ‘인플렉션 포 엔터프라이즈(Inflection for Enterprise)’를 출시한다.

시스템은 공감형, 대화형 및 직원 친화적인 AI 기능을 제공한다. 복잡하고 대규모로 배포되는 환경에서 필요한 제어, 맞춤화, 및 확장성을 지원한다. 현재 이 시스템은 AI 클라우드를 통해 제공된다. 내년 1분기에 가우디3를 탑재한 AI 어플라이언스로 고객에게 출하할 예정이다.

저스틴 호타드 인텔 데이터센터 및 AI 사업 총괄 수석부사장은 "오픈소스 모델과 툴 지원, 그리고 뛰어난 와트(watt)당 성능을 자랑하는 인텔 가우디3 솔루션은 모든 규모의 기업이 생성형 AI를 합리적인 비용으로 쉽고 효율적으로 도입할 수 있도록 지원한다"고 말했다.

가우디3는 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME) 등을 통해 심층 신경망 연산을 가속화하는 AI 가속기다. 학습 및 추론을 위한 128GB(기가바이트)의 3세대 고대역폭메모리인 'HBM2E' 메모리와 24개의 200Gb 이더넷 포트를 장착했다.

가우디에 탑재된 HBM2E는 국내 SK하이닉스와 삼성전자, 미국 마이크론 등 주요 3사 모두가 제공하는 것으로 알려졌다. 앞서 호타드 수석 부사장은 "HBM 공급 업체들과 모두 협력하고 있다"고 밝힌 바 있다.

인텔은 기존 인플렉션 AI의 Pi 소비자 애플리케이션이 엔비디아 GPU에서 실행되었지만, 인플렉션 3.0은 온프레미스 또는 클라우드에서 AI 클라우드로 구동되는 인스턴스와 함께 가우디 3로 구동된다며 "이는 배포 시간을 단축시킬 뿐만 아니라 총소유비용(TCO)도 절감한다"고 설명했다.

나승주 인텔 데이터센터 및 AI 사업부 한국영업 총괄 상무는 "가우디3는 추론 처리량에서 H100보다 최대 1.19배 성능이 더 좋고, 이 성능을 가격과 함께 따지면 가성비는 2배 이상 우위에 있다"고 말했다.

가우디3는 엔비디아 H100 가속기 가격의 3분의2 수준으로 제공될 전망이다. H100의 가격은 3만달러(약 4000만원)에 달한다.

인텔과의 파트너십을 통해 제공되는 인텔 가우디3 AI 가속기는 탁월한 성능과 업계 최고 수준의 가격 대비 성능을 제공함으로써 효율적이면서도 최상의 결과를 창출하며, 인텔의 기술은 유연성과 확장성을 보장하여 높은 효과를 발휘한다.

이런 서비스의 가치와 이점을 바탕으로, 인텔과 인플렉션 AI는 인텔이 이 솔루션의 초기 고객이 될 것으로 예상하며, 인텔 내부에 인플렉션 포 엔터프라이즈를 도입하기 위해 협력하고 있다.

테드 쉘튼 인플렉션 AI 최고운영책임자(COO)는 "CEO나 CTO들과 대화해보면 현재 시장에 나와 있는 AI 툴이 진정한 엔터프라이즈급이 아니라는 점에 대해 불만을 가지고 있다"며 "이번 협력을 통해 이러한 문제를 해결하는 AI 시스템을 제공하게 됐으며, 인텔 가우디에서 얻는 성능 향상을 통해 모든 기업의 요구를 충족하도록 확장할 수 있다"고 말했다.

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.