[GAM] '구글 TPU 위협론' 엔비디아 강세론자들의 항변, 4가지 논거

2025-11-26

강세론자들 '일시적 충격' 반박 논리 제시

4개 논거, 생태계와 멀티클라우드 환경 등

"'제로섬 대결'로 봐선 안 돼, 모두가 '팽창'

이 기사는 11월 26일 오전 09시35분 '해외 주식 투자의 도우미' GAM(Global Asset Management)에 출고된 프리미엄 기사입니다. GAM에서 회원 가입을 하면 9000여 해외 종목의 프리미엄 기사를 보실 수 있습니다.

[서울=뉴스핌] 이홍규 기자 = 엔비디아의 구글 TPU(텐서처리장치)발 주가 급락은 일시적 충격에 그칠 수 있다는 주장이 강세론자 사이에서 나온다.

엔비디아가 GPU(화상처리장치) 중심의 인공지능(AI) 개발 생태계와 클라우드 운영 환경을 장악하고 있어 단기간 '1강 체제'가 흔들리기 어려워 보이고 AI 반도체 시장 자체는 팽창 중이라 당장 GPU와 TPU의 '제로섬 대결' 구도로 봐서는 안 된다는 관점이다.

◆TPU 위협론 '공포'

25일(현지시간) 엔비디아(NVDA) 주가는 전날 종가보다 3% 급락한 177.82달러에 마감(구글 <모회사 알파벳, GOOGL> 1% 상승) 했다. 메타가 자사의 데이터센터에 구글 TPU를 배치하는 방안을 검토 중이라는 보도가 나온 영향이다. 엔비디아 GPU에 의존해 온 메타가 눈을 돌릴 만큼 TPU 성능이 향상됐다는 신호로 읽혀 구글 TPU발 위협론이 고개를 들었다.

☞[GAM] ②알파벳, 'AI 백면서생' 오명을 프리미엄으로 바꾸다

TPU는 구글이 2013년부터 개발한 AI 연산용 반도체다. 범용 연산이 가능한 GPU와 다르게 특정 용도에 최적화된 일종의 ASIC(주문형반도체)다. AI 모델을 훈련하는 '학습'보다 학습된 모델을 실행하는 '추론' 작업에서 전력 효율이 높다고 알려져 있다. 브로드컴과 협업 구조로 개발했다.

구글의 TPU의 성능은 최근 호평받는 '제미나이3'와 함께 부상했다. 제미나이3는 전적으로 구글 TPU으로 훈련된 모델이다. 구체적인 제품명은 7세대 TPU인 아이언우드(TPUv7)로 추론 성능에서는 칩당 4.6페타플롭스의 성능을 낸다고 한다. 엔비디아의 최신 GPU인 B200(4.5페타플롭스)와 대동소이하다.

◆방어선1: 생태계

구글 TPU발 위협론에 대항하는 강세론자들의 첫 방어선은 생태계다. AI 엔지니어 대부분이 대학 시절부터 엔비디아 GPU를 활용해 소프트웨어를 개발하는 도구인 'CUDA'를 배웠고 현재 AI 개발 업계의 표준은 CUDA와 메타가 오픈소스로 개발·공개한 '파인토치'의 조합으로 굳어져 있다.

반면 TPU는 구글이 개발한 머신러닝 라이브러리인 'JAX'와 딥러닝 프레임워크인 '텐서플로'를 사용한다. 구글이 최근 파이토치도 지원하기 시작했지만 수년 동안 축적된 라이브러리와 개발 생태계를 단기간 내 따라잡기 어렵다는 논리다.

TPU로 전환하려면 코드 포팅(이식)과 재튜닝(재최적화) 등 상당한 마찰 비용이 발생한다. 이 때문에 AI 개발 자체는 한동안 GPU 중심으로 계속 굴러갈 가능성이 크다는 주장이 붙는다. 시킹알파의 한 기고자는 "구글 TPU를 살 이유는 엔비디아 GPU를 충분히 확보하지 못할 때뿐"이라며 성능과 총소유비용(TCO) 측면에서 아직 엔비디아가 앞서 있다고 주장했다.

◆방어선2: 클라우드 환경

두 번째 방어선은 클라우드 환경이다. 엔비디아 GPU는 아마존의 AWS·마이크로소프트 애저(Azure)·구글클라우드(CGP) 등 3대 클라우드 플랫폼 모두에서 사용이 가능하다. 반면 TPU는 GCP에서만 쓸 수 있다. 기업 고객 대부분이 멀티클라우드 전략을 취하는 상황에서 폐쇄적인 환경은 약점이다.

한 TPU와·엔비디아 GPU 병용 고객은 알파센스 인터뷰에서 "데이터가 다른 클라우드에 있으면 엔비디아 워크로드는 코드 변경 없이 그대로 옮겨 실행할 수 있다"고 했다. 이어 "TPU에 전적으로 의존했다가 구글이 가격을 10배 올리면 속수무책"이라며 관련 이유로 아마존이 개발한 ASIC인 '트레이니엄'과 '인퍼렌티아' 역시 전면 사용을 꺼린다고 했다.

'칩 워(Chip War)'의 저자 크리스 밀러는 "ASIC는 실리콘에 새겨지면 변경할 수 없어 유연성 측면에서 제약이 있다"고 했다. ASIC는 특정 작업에 최적화돼 설계된 만큼 일단 칩이 완성되면 용도를 바꿀 수 없다는 뜻이다. 예로 AI 모델의 연산 방식이 달라지거나 새 기능이 필요해지면 기존 칩으로는 대응이 불가피해져 새 칩을 설계해야 한다는 거다.

◆방어선3: 기술 격차

시킹알파의 또다른 기고자는 엔비디아가 CoWoS(고급패키징 기술; 다중 칩·HBM 단일 기판 집적 기술)과 블랙웰 아키텍처를 앞세워 AI 연산용 반도체 시장의 핵심 수혜자 지위를 유지하고 있다고 했다. 미즈호의 비제이 라메시 애널리스트도 엔비디아의 블랙웰과 출시와 계획된 루빈 신제품 강점을 들어 엔비디아에 대해 긍정적 전망을 유지했다.

다만 구글의 TPU가 기술 격차를 상당 부분 좁혀왔다는 점은 대체로 인정하는 분위기다. 전 클라우드 직원은 알파센스 인터뷰에서 "TPUv6의 경우 GPU보다 60~65% 더 효율적"이라고 했다. 관련 GPU는 엔비디아 전 주력 제품인 호퍼를 언급한 것으로 보인다. 그럼에도 강세론자들은 엔비디아는 블랙웰 울트라(B300)로 칩당 288GB 메모리를 제공하는 등 격차를 유지하고 있다고 반박한다.

◆방어선4: 시장 확대

가장 근본적인 방어 논리는 AI 시장 자체의 폭발적 성장이다. 번스타인의 스테이시 래스건 애널리스트는 "GPU는 분명히 사라지지 않는다"며 "지금은 연산자원이 부족한 국면이고 이번 움직임(메타의 TPU 도입 검토 보도)은 더 많은 자원을 확보하려는 노력"이라고 해석했다.

그는 이어 "'ASIC냐 GPU냐'라는 구도의 논쟁은 본질을 비껴갔다"며 "진짜 질문은 '우리 앞에 놓인 기회가 여전히 크냐'여야 한다"고 했다 그러면서 "파이가 크면 GPU와 ASIC 모두 번성하고 작으면 둘 다 어려워진다"고 했다.

뱅크오브아메리카(BofA)의 비벡 아리아 애널리스트는 AI 데이터센터 시장이 아직 초기 성장 단계라고 했다. 그는 전체시장규모(TAM)이 올해 말 2420억달러에서 2030년까지 약 5배 성장해 1조2000억달러를 초과하는 수준에 이를 것이라고 했다.

DA데이비슨의 길 루리아 애널리스트도 메타의 TPU 도입 검토 보도에 대해 "구글 TPU 수요가 늘고 있다는 데이터포인트(하나의 참고 자료)일 뿐"이라며 칩 수요 전체가 확대되는 신호로 해석했다.

bernard0202@newspim.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.