“회장님, GPU 구하기가 하늘에 별 따기입니다.”
최근 한국소프트웨어산업협회 회원사들이 자주 하는 말이다. 그간의 관례로 볼때 소프트웨어(SW)를 대표하는 단체장에게는 이례적으로 들릴만한 하소연이다.
글로벌 인공지능(AI) 산업의 경쟁이 심화되면서 GPU와 같은 컴퓨팅 자원의 확보가 기업의 성패를 좌우하는 중요한 요소로 떠오르고 있다. 메타와 마이크로소프트(MS)는 지난해 엔비디아의 슈퍼컴퓨터용 GPU인 H100을 무려 15만 개 구매했다. 내년까지 50만 장 이상을 추가로 확보할 계획을 발표했다.
그러나 대한민국이 보유한 H100은 겨우 4000여 장에 불과하다. 마치 영화 300 속, 100만 명의 페르시아군에 맞서 싸운 스파르타의 300용사처럼, 글로벌 AI 기업과 맞서 싸워야 하는 대한민국 기업의 상황은 수적 열세 속에서 고군분투하는 그들의 심정과 닮아 있다.
최근 오픈AI는 브로드컴, TSMC 등 아시아 대표적인 파운드리 기업들과 협력해 자체 AI 칩 개발에 속도를 내고 있다. 이는 현재 세계 시장에서 90% 이상의 점유율을 차지하는 엔비디아에 대한 의존도를 낮추기 위한 선택으로 당장의 방대한 칩 수요를 해결하기 위한 전략적 움직임으로 보인다. 오픈AI뿐만 아니라 MS, 구글, 아마존, 메타, 테슬라 등 빅테크 기업 역시 엔비디아 칩의 높은 비용과 제한된 공급 문제로 인해 독자적인 AI 칩 개발에 나서고 있으며, 애플 또한 데이터센터용 AI 칩을 개발하고 있는 상황이다.
글로벌 AI 기업이 이렇게 반도체 시장에 직접 뛰어드는 이유는 AI 학습과 추론의 기반이 되는 거대 언어 모델(LLM) 유지에 막대한 연산용 칩이 필수적이기 때문이다. H100 한 개 가격이 최대 6000만 원에 이르는 상황에서, 이를 얼마나 확보할 수 있는가에 따라 기업 경쟁력이 크게 달라지는 실정이다. 이러한 거대 자본을 동원하는 글로벌 빅테크들의 구매 공세는 국내 기업에게 부담이 되고 있다.
그렇다면 국내 기업들은 이 거대한 자본 공세에 어떤 전략으로 대응할 수 있을까?
컴퓨팅 자원이 상대적으로 덜 소요되는 소규모 언어 모델(sLLM) 기반의 '버티컬 AI' 전략이다. 약 2조 가까이가 추정되는 GPT-4와 같은 LLM에 비해 매개변수 수가 적어 '소규모'로 불리는 이 모델은 비용 효율성이 높고 학습 과정에서 환각 현상(할루시네이션) 발생이 적어 보다 정확하고 신뢰할 수 있는 비즈니스 맞춤형 서비스를 제공할 수 있다. 대표 사례로 MS의 '파이3(Phi-3)'나 구글의 '젬마2(Gemma2)'를 들 수 있다.
sLLM 기반의 버티컬 AI 활성화를 통해 국내 기업들도 상대적으로 적은 규모의 컴퓨팅 자원으로 성과를 창출할 가능성이 열려 있다. 그러나 이는 여전히 상당한 투자가 요구되는 분야이므로 단일 기업의 투자만으로는 한계가 있을 수밖에 없다. 이에 따라 민간과 공공이 함께 투자할 수 있는 체계를 마련하는 것이 중요하다.
대한민국의 AI 산업이 글로벌 빅테크 기업들과의 경쟁에서 뒤처지고 있는 원인 중 하나는 AI 반도체 수급 문제와 더불어 에코시스템(자립적 생태계)의 부재다. AI 반도체 국산화는 상당한 자본과 시간이 요구된다. 기존 주력 사업에 막대한 투자가 이뤄지고 있는 상황에서 새로운 반도체 라인을 구축하고 연구개발(R&D) 자원을 할애하는 것은 대기업이라 할지라도 리스크가 크다. 대기업과 스타트업간 협력이 아름다운 모델이 될 수는 있겠지만 기술개발과 확장을 목표로 하는 스타트업과 전략적 투자를 이행해야 하는 대기업간 이해관계가 충돌할 수밖에 없다.
정부는 AI 반도체의 국산화를 위한 연구개발(R&D) 지원 펀드를 조성해 대기업뿐만 아니라 스타트업, 중소기업, 연구기관 등 다양한 주체가 참여할 수 있는 자금을 제공해야 한다. 다행히 최근 국가 인공지능위원회의 출범과 함께 과학기술정보통신부는 AI 컴퓨팅 센터 설립과 약 2조 원 규모의 민관 투자 유치를 통해 자원 확보를 추진, 긍정적 평가를 받고 있다. 향후 투자 유치가 원활히 이뤄질 수 있도록 세심한 정책적 지원이 뒤따른다면 공동 투자 전략이 한층 효과를 발휘할 것이다.
국산 신경망처리장치(NPU) 확산에 대한 관심도가 커지면서 스타트업을 중심으로 한 팹리스 기업과 대기업간 협업이 늘면서 긍정적 성과들이 속속 나타나고 있다. 다만, 국산 NPU는 여전히 GPU에 비해 성능이 다소 떨어진다는 평가가 많아, R&D와 인재 양성에 대한 투자가 긴요한 시점이다. GPU와 성능 격차를 줄이고자 하는 속도감 있는 개발이 필요하며, 시스템 SW 분야에서도 현재 엔비디아 CUDA(GPU가 구현되는 플랫폼)에 높은 의존성을 탈피하기 위한 독자적 R&D가 필요하다.
CUDA 의존도 해소를 위해서는 글로벌 협력을 강화해야 한다. 국내 AI 반도체 기업(사피온, 퓨리오사AI 등)과 인텔, AMD 등 글로벌 기업과 공동연구를 통해 시스템 소프트웨어 개발을 가속화하고 협력 프로그램을 확대해 최신 기술 동향 및 노하우를 국내에 적극 도입해야 한다. 이미 국내 일부 기업과 연구기관에서는 오픈API와 ROCm을 도입하여 개발을 진행 중이며, 이를 통해 CUDA에 대한 의존도를 줄이고 있다.
더불어 국산 NPU를 확산하기 위해 대학이나 연구소 등에도 보급해 저변을 확대하는 것이 중요하다. 대학과 연구소가 국산 NPU 기반의 연구 환경을 구축하고 학생들이 실제 NPU 기술을 다룰 수 있는 경험을 제공함으로서, 실제 상용화로 이어질 수 있는 협력 체계를 마련하고 NPU 설계·개발·제조에 필요한 전문 인재를 체계적으로 양성할 수 있다.
과거 국가들이 자원 확보를 위해 군사적, 산업적 경쟁에 몰두했다면 이제는 '칩 전쟁(Chip War)'의 시대가 도래했다. 산업 전반과 첨단 무기체계에 AI가 필수로 자리 잡은 지금, 정부는 기술 상용화를 위해 장기적인 자금을 지원하는 동시에 대기업, 중소기업, 연구기관간 협력을 촉진할 수 있는 민관협력형 에코시스템을 구축해야 한다.
정부가 중재자이자 조정자가 돼 각 참여자가 상호 보완적으로 협력할 수 있도록 유도하고 개별 기업이 사업에 집중할 수 있다면 기술자립화와 글로벌 경쟁력을 갖춰 이 경쟁 속에서 승자로 살아남을 수 있을 것이다.
조준희 한국소프트웨어산업협회장 jhjoh@sw.or.kr
〈필자〉 2001년 유라클을 창업해 23년 동안 대표이사직을 수행하고 있는 소프트웨어(SW) 기업가다. 2021년부터 법정단체 한국소프트웨어산업협회 제18대·19대 회장을 연임하며 SW산업 발전과 생태계 개선을 위해 앞장서고 있다. 2022년 대통령 직속 디지털플랫폼정부위원회 산업생태계분과위원장직을 맡은데 이어 2023년 민관협력 글로벌DPG얼라이언스 초대 의장, 2024년 AI전략최고협의회 위원에 임명됐다. 또한 국가과학기술자문회의 자문위원, 국무총리실 산하 데이터기반행정활성화위원회 위원, 벤처기업협회 수석부회장, 재단법인 이노베이션아카데미 사외이사, 한국과학기술단체총연합회 부회장, 한국공학한림원 회원 등 SW와 정보통신기술(ICT) 산업 발전을 위해 활발한 정책활동을 하고 있다.