오픈AI는 GPT-5가 이전 모델들에 비해 성능 개선폭이 크지 않을 수 있다는 점을 인식하고, 새로운 방식을 모색 중이라고 한다.
오픈AI는 GPT-5 개발 과정에서 기존 공용 데이터와 라이선스 계약에 의존하던 방식에서 벗어나, 새로운 데이터를 직접 생성해서 훈련에 활용하기 시작했다. 이를 위해서 코드를 작성하거나 수학 문제를 해결하는 작업에 대한 별도의 인원을 고용했으며, 또 다른 자체 추론 모델인 o1을 활용해 생성된 합성 데이터도 활용 중이다.
월스트리트 저널은 GPT-5의 18개월에 걸친 개발 과정에 대한 자세한 내용을 보도했다. 내부적으로 오리온(Orion)이라는 코드명으로 불리는 이 프로젝트는 현재까지 데이터를 대량으로 학습시키는 최소 두 번의 대규모 훈련 과정을 진행했다. 하지만 초기 훈련 과정이 예상보다 진행 속도가 느리며, 이는 더욱 대규모 훈련에 시간과 비용이 더 많이 소요될 것임을 시사한다.
GPT-5가 이전 모델들의 성능을 능가할 수 있다는 보고에도 불구하고, 운영 비용을 감당할 만큼 충분히 발전하지 못했다는 평가가 나오고 있다. 이에 따라서 개발을 계속 진행할 가치가 있는지에 대한 의문도 제기된다. 오픈AI는 이와 관련된 우려나 GPT-5의 미래 계획에 대한 공식적인 입장을 아직 내놓지 않았다.
베타뉴스 이직 기자 (leejik@betanews.net)