손가락만 한 NPU가 GPGPU를 압도한다니, 반도체 대전 딥엑스의 제품들

2024-10-24

국내 NPU 제조업체 딥엑스(DeepX)가 반도체대전 2024에서 제품과 솔루션을 선보였다. 딥엑스는 다른 국내 NPU 제조업체와 다르게 가장 작고 저전력인 제품을 만드는 회사다. 현시점 주력 제품인 DX-M1은 과장 없이 사람의 손가락 하나 정도의 크기밖에 되지 않는다. M.2 인터페이스를 탑재한 초저전력 NPU인 DX-M1은 IPC(산업용 PC)는 물론, 싱글 보드 PC인 라즈베리 파이나 오렌지 파이에도 탑재해 비전 랭귀지 모델 분석을 행할 수 있다.

비전 랭귀지 모델(VLM)은 일반적인 비디오 서베일런스(CCTV) AI에서 한단계 더 나아가, 추락 감지, 화재 등의 장면을 비전 센서로 파악하고 이를 AI가 해석해 화면의 상황을 설명해 주는 모델을 말한다. 반도체대전 전시 현황에서 확인한 결과, 오렌지파이 싱글 보드 PC 한대만으로도 VLM 구동이 가능했다. 솔루션은 피아스페이스의 것을 사용했으며, 이를 DX-M1에 최적화한 형태다.

오렌지파이보다 성능이 높은 IPC로는 다채널 AI CCTV를 만들 수 있다. 대만 IPC 제조사인 바이오스타의 IPC에 DX-M1을 탑재해 주차장 화재, 사람간의 다툼, 낙상 사고, 가정 내 화재 등 다양한 상황의 화면을 DX-M1만으로 구동 및 분석이 가능하며, 이를 통해 다채널 CCTV를 구성할 수 있다. 화면에 인시;식된 상황은 경찰서나 소방서에 바로 전달되도록 만들 수 있어 재난 상황 발생 시 효과적인 예측이 가능하다.

구동 PC를 엣지 디바이스나 워크스테이션으로 확장할 경우, 100개 채널의 상황까지 파악할 수 있다. PCIe 인터페이스용으로 개발된 DX-H1을 사용할 경우, 개당 100TOPS의 성능을 보장받을 수 있으며, 2개를 사용해 100개 채널을 활용하는 모습을 딥엑스는 전시하고 있었다.

다른 업체 대비 딥엑스 NPU가 가지는 장점들은 무엇일까? 딥엑스의 DX-M1 등 제품은 철저한 저전력에서 높은 성능을 내도록 설계됐다. 산업용으로 쓰이는 GPGPU와 비교하면, DX-M1의 TOPS 수치는 25TOPS로 스마트폰이나 노트북의 TOPS 수치에도 미치지 못한다. GPGPU의 경우 기준에 따라 130~200TOPS의 INT8(8비트 정수연산)을 보인다. 그러나 정한별 딥엑스 영업마케팅 이사는 “AI 모델 분석 정확도는 GPGPU 대비 높은 것이 딥엑스 제품의 장점”이라고 설명했다. 물리적인 트랜지스터 수가 많을수록 높아지는 TOPS 수치와 별개로 AI를 분석하는 정확도는 더 높다는 뜻이다. 이것이 가능한 이유에 대해 물었더니 “제품의 장점을 100% 활용하는 최적화를 여러 번 거쳤기 때문”이라고 대답했다. 실제로 딥엑스 재직 인원 중 2/3 정도가 소프트웨어 개발진일 정도로 소프트웨어에 많은 공을 쏙든다. 반대로 AI 연산만을 하기 위해 만들어진 것은 아닌 GPGPU의 경우 하드웨어를 AI 분석에 십분 활용하기 어려울 수도 있다고 해석할 수 있다.

딥엑스는 모델 분석 정확도를 높이기 위해 코어 기술인 INT8 모델 압축 기술 ‘IQ8™’과 GPU 대비 수십분의 일 이하로 D램 사용을 최소화하는 기술인 ‘Smart Memory Access’ 기술 등을 개발해 복잡한 AI 모델의 정확도를 열화 없이 경량화하고 있다고 전했다.

딥엑스가 주로 내세우는 수치는 실효 AI 연산 성능비(FPS/TOPS)로, 초당 프레임 수를 TOPS 수치로 나눈 것이다. 이 성과에서도 GPGPU보다 DX-M1의 수치가 훨씬 높다. 딥엑스의 강점인 1. 부품 활용도를 최대한 높인 것 2. 소프트웨어 최적화가 동시에 이뤄진 결과다.

딥엑스는 반도체 대전 현장에서 본사가 경쟁 제품이라고 생각하고 있는 이스라엘 반도체 기업의 NPU를 놓고 ‘버터 벤치마크’도 전시하고 있었다. 차량을 비롯한 객체를 비전 센싱하는 장면을 담은 것으로, DX-M1은 해당 비디오 분석을 위해 35.5°C만큼의 열만 발생시키고 있어 버터가 녹는 36°C까지는 도달하지 않는 모습을 보여줬다. 경쟁 제품은 60.7°C의 열을 발생시켜 버터를 녹이고 있음을 시연했다. 이는 동일한 작업을 수행할 때 경쟁 제품 대비 뛰어난 열 효율을 보여주고 있음을 시사했다.

“생성형 AI 등장 이전인 2018년에 창업했는데, 생성형 AI 시대가 올 것은 알고 있었냐”는 질문에 정 이사는 “대표님은 그렇다고 한다”고 답했다. 김녹원 딥엑스 대표는 UCLA에서 박사학위를 취득한 인물로, 브로드컴, IBM, 시스코시스템즈에서 AP 설계를 담당했고, 애플에서도 NPU 설계를 해온 바 있다. 김 대표는 IoT 시장이 성장하는 걸 보며 초지능 사회가 올 것임을 실감했고, NPU 내부의 S램 처리에 많은 공을 들였다고 한다. 현재 경쟁사 제품은 32~50MB의 캐시 메모리를 사용하지만 딥엑스는 그것보다 1/4 정도로 적은 용량의 램만을 사용하며, 소프트웨어 최적화를 통해 AI 정확도를 보장한다고 밝혔다. 현재 전 세계 기업 중 NPU 관련 특허를 삼성 다음인 두번째로 많이 보유한 기업이기도 하다.

딥엑스는 현재 다양한 기업과 협업해 다양한 VLM을 개발 중이다. 현대차의 모델을 활용해 얼굴 인식 소프트웨어를 테스트 중이며, 객체 인식, 사람의 신체(포즈) 인식, 실시간 분석을 함께 실행하는 모델을 개발 중이다. 또한, LG U+와 sLLM을 활용한 엣지용 AI도 함께 개발 중이다.

현재 주력 제품은 DX-V3, DX-M1, DX-H1 세가지로, 비전 시스템에 특화되어 있는 DX-V3는 TSMC 12nm공정에서 MPW(Multi Project Wafer, 한장의 웨이퍼로 여러 제품을 생산하는 방식)로 제작될 계획인 스탠드 얼론(Stand Alone) 칩이다. 카메라 외 3D 센서 처리가 필요한 자율 주행, 로봇 비전 등에 특화돼 있다. DX-M1은 삼성 파운드리 5nm공정에서 양산될 계획이며 칩 하나로 16채널 이상의 다채널 영상에서 초당 30FPS로 실시간 연산처리가 가능하다. AI 서버용 DX-H1 역시 삼성 5nm공정에서 제작되는 PCIe 카드 제품이며 AI 추론 전용 GPGPU 대비 성능, 전력, 비용 효율성을 극대화한 제품이다.

구체적인 수익화 시점을 물었더니 “내년 말”이라는 대답이 돌아왔다. 현재 시제품들을 기업에 공급한 상태이며, 소프트웨어 벤더나 AI 기업 등과 함께 최적화를 진행 중이며, 성능 검증 기간이 끝나면 구체적인 매출이 나올 것으로 딥엑스 측은 예상했다.

글. 바이라인네트워크

<이종철 기자> jude@byline.network

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.