![](https://newsimg.sedaily.com/2025/02/12/2GOXWL68OK_1.jpg)
초거대 AI 개발 기업 '트웰브랩스'가 고도화된 영상언어 생성 모델 '페가수스-1.2'를 12일 공개했다. 기존 버전보다 성능이 한층 개선돼, 다양한 산업 현장에서의 활용성이 더욱 커질 것으로 기대된다.
800억 파라미터 규모 초거대 영상언어 생성 모델인 페가수스는 2023년 11월 첫 번째 모델이 개발됐다. 이 모델은 긴 영상을 텍스트로 요약하거나 영상에 관한 자유로운 질의응답을 할 수 있도록 지원하는 것이 특징이다.
이번에 공개된 페가수스-1.2는 기존 버전 대비 성능이 크게 개선됐다. 영상의 화면과 음성을 동시에 분석해 텍스트로 변환하는 능력이 한층 강화됐으며, 다양한 길이의 영상을 최고 수준의 정확도로 처리할 수 있다.
또 영상을 효율적으로 저장·재사용하는 기술을 통해 이미 한 번 처리한 영상은 다음 분석 시 더 빠르고 경제적으로 처리할 수 있다. 이처럼 영상의 맥락과 세부 내용을 정확하게 파악해 요약본, 하이라이트, 상세 보고서 등 다양한 형태의 텍스트로 만들어내는 능력은 실제 산업 현장에서 큰 활용 가치를 가질 것으로 기대된다. 이승준 트웰브랩스 최고기술책임자(CTO)는 “페가수스-1.2는 혁신적인 시공간 정보 이해 방식을 도입해 영상을 정확하게 이해하는 것이 특징"이라고 설명했다.