구글, 3개월만에 추론형 AI 모델 “제미나이 2.5” 프로 발표

2025-03-26

구글은 25일(현지시각) 추론의 성능을 강화한 AI 모델 ‘제미나이 2.5 프로(Gemini 2.5 Pro Experimental)’을 공개한다고 밝혔다. 작년 12월 ‘제미나이 2.0’이 공개됐는데, 불과 3개월 남짓이 지나 새로운 모델을 선보인 것이다. 구글 딥마인드의 최고기술책임자(CTO) 코레이 카부쿠오글루는 “‘제미나이 2.5 프로’는 여러 벤치마크에서 선두를 달리며, 강력한 추론 기능을 탑재했다”고 설명했다.

추론형 AI 모델은 맥락을 이해하고 정보를 바탕으로 논리적 결론을 도출할 수 있는 AI를 말한다. 질문에 단순한 답을 제공하는 챗봇과 달리 깊이 생각한 답변을 내놓는다. 이러한 추론형 AI 모델은 오픈AI, 앤트로픽, 딥시크 등 여러 기업이 중점을 두고 개발하고 있다. 추론 기능은 앞으로 다가올, 인간의 개입을 최소화하는 자율형 AI 에이전트의 핵심 구성 요소가 될 것으로 전문가들은 예측한다.

회사 측에 따르면, 제미나이 2.5 프로는 강화학습과 사고의 사슬(CoT) 프롬프팅 방식으로 훈련됐다. 강화학습은 AI가 긍정과 부정적인 피드백을 통해 스스로 학습하는 방식이다. CoT 프롬프팅은 복잡한 문제를 단계별로 분해해 결론을 도출하는 방식이다. 두 방식 모두 AI가 어려운 문제를 해결하는 데에 중요한 역할을 한다. “제미나이 2.0에 이어 더 향상된 추론 모델을 제공하고, 앞으로 발표될 모든 모델에 추론 기능을 탑재할 예정”이라고 카부쿠오글루 CTO는 밝혔다.

카부쿠오글루 CTO는 제미나이 2.5 프로의 성능이 뛰어나다는 결과를 공유했다. 게시된 내용에 따르면, 챗봇의 대답으로 선호도를 측정하는 테스트인 LM아레나 리더보드에서 제미나이 2.5 프로는 1위를 차지했다. 오픈AI의 o3 미니, 오픈AI의 챗지피티 4.5, 앤트로픽의 클로드 3.7 소넷, 딥시크의 R1 등과 비교한 결과다. 그리고 수학과 과학 벤치마크에서도 오픈AI 모델을 뛰어넘으며 상위권을 차지했다.

그 중 ‘인류의 마지막 시험’이라는 수학, 인문학, 자연과학과 관련된 수 천개의 어려운 문제를 시험하는 벤치마크에서 18.8%의 점수를 기록했다. 이 벤치마크에서는 오픈AI의 o3 모델이 14.0%, 나머지 모델들이 10% 이하의 점수를 기록한 바 있다.

카부쿠오글루 CTO는 “현재 개발자 플랫폼인 구글 AI 스튜디오와 제미나이 어드밴스드 구독자(월 2만9000원)를 위한 제미나이 앱에서 제미나이 2.5 프로를 사용할 수 있다”고 밝혔다. 다만, 패키지 제공이 아닌 제미나이 2.5 프로의 구체적인 가격을 공개하지는 않았다. 이에 그는 “몇 주안에 가격을 책정해 공개하겠다”라고도 덧붙였다.

글. 바이라인네트워크

<최가람 기자> ggchoi@byline.network

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.