“학습 데이터가 부족해”… 오픈AI '챗 GPT-5 개발' 기약 없다

2024-12-23

챗GPT 개발사 오픈AI의 차세대 주력 인공지능(AI) 모델 개발이 지연되고 있다.

22일(현지시간) 월스트리트저널(WSJ)은 여러 소식통을 인용해 코드명 '오리온(Orion)'으로 알려진 오픈AI의 차세대 AI 모델 GPT-5는 개발 일정이 기약 없이 지연되고 있다고 전했다.

당초 오픈AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반 새로운 모델이 나올 것으로 예상했다.

오픈AI는 지금까지 18개월이 넘는 개발 기간 중 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했다. 하지만 매번 새로운 문제가 발생했고, 기대했던 결과를 얻지 못했다.

새 모델은 기존의 GPT-4보다는 나은 성능을 보였지만, 여기에 투입된 막대한 비용을 정당화할 만큼의 충분한 진보는 보여주지 못했다고 WSJ는 전했다.

업계는 이 정도의 대규모 AI 훈련에는 6개월간 컴퓨팅 비용만으로 약 5억달러(약 7247억5000만원)가 소요될 수 있다고 추정했다.

이전 모델의 경우 오픈AI는 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등 데이터를 AI 훈련에 사용했으나, 새 모델을 개발하는 과정에서는 더 지능적인 훈련에 필요한 데이터가 그만큼 충분하지 않은 것이 주요 난관으로 꼽혔다.

이 문제를 해결하기 위해 오픈AI는 새로운 데이터를 직접 만들기로 하고, 소프트웨어 엔지니어나 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록 해 AI가 이를 학습하게 하는 방식을 시도하고 있지만, 이런 과정은 기존 방식보다 매우 긴 시간이 걸린다.

WSJ는 이처럼 내부적인 어려움에 더해 경쟁업체에서 수백만달러를 제시하며 최고 연구원을 빼가려는 시도가 끊이지 않아 비용 부담을 키운다고 전했다. 올해 일리야 수츠케버 오픈AI 공동 창업자를 비롯해 20명 이상이 오픈AI를 떠났다.

수츠케버는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다”며 “우리가 가진 인터넷은 오직 하나뿐이기 때문”이라고 지적했다.

그는 AI 모델 학습·훈련에 필요한 데이터를 유한한 자원인 화석연료에 비유하면서 “우리가 알고 있는 (생성형 AI 모델의) 사전 훈련은 의심할 여지 없이 끝날 것”이라고 단언했다.

한편, 샘 올트먼 오픈AI 최고경영자(CEO)는 지난 20일 고급 추론 AI 모델 'o3'를 공개했지만, GPT-5라고 부를 만한 새 주력 모델이 언제 나올지에 대해서는 언급하지 않았다.

이원지 기자 news21g@etnews.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.