카카오, AI 풀 라인업 공개…멀티모달·비주얼 생성 모델 '실용성' 확보

2024-10-23

카카오가 다양한 인공지능(AI) 모델 풀 라인업을 공개했다. 실용성을 필두로 AI 기술 및 서비스 분야 경쟁력 확보에 본격 나섰다.

카카오는 23일 경기 용인시 카카오 AI 캠퍼스에서 열린 '이프 카카오(if kakao) AI 2024'에서 AI 모델 패밀리 전체 라인업을 공개했다.

카카오의 AI 모델인 '카나나'는 언어모델(LLM) 3종과 멀티모달 언어모델(MLLM) 3종, 비주얼 생성모델 2종과 음성모델 2종으로 구성됐다.

언어모델은 크기에 따라 △초거대 '카나나 플래그' △중소형 '카나나 에센스' △ 초경량 '카나나 나노'로 나뉜다. 멀티모달 언어모델은 △카나나-o △카나나-v △카나나-a로 구분된다. 통합 멀티모달 언어모델, 이미지·비디오 언어모델, 오디오 언어모델이다.

비주얼 생성 모델은 개인화된 이미지 생성 모델인 '콜라주(KOLLAGE)'와 비디오 생성 모델인 '키네마(KINEMA)'로 나뉜다. 텍스트 입력부터 이미지, 개인 프로필 사진까지 다양한 입력을 처리하는 형태로 개발 중이다. 음성모델의 경우 음성인식 모델인 '카브(KARVE)'와 음성합성 모델인 '캐스트(KAST)'가 있다.

카카오는 AI 서비스화를 앞두고 LLM을 고도화 중이다. 상호작용을 이끌어내는 '대화' 능력, 이용자에게 정확한 지식과 통찰력을 바탕으로 답변을 제공하는 '지식', 대화 흐름 및 액션과의 '연결' 등이 핵심이라 짚었다. 아울러 고성능, 비용 효율도 갖췄다. 저작권이나 개인정보 이슈가 해소된 데이터를 기반으로 전처리 작업을 진행, 투명성을 확보했다.

김병학 카나나알파 성과리더는 “기술의 가치는 이용자의 문제를 직접적으로 해결해는 등 실용적인 서비스로 구현돼야 빛을 발한다”며 “다양한 카나나 모델을 토대로 AI Native 컴퍼니로의 기반을 확대하겠다”고 밝혔다.

정규돈 카카오 CTO는 사내 'AI 네이티브' 전략을 소개했다. 먼저 AI 도입을 체계적으로 관리하기 위해 성숙도 레벨 지표를 마련했다. 단계는 △탐색 △적용 △혁신 △일상 등 4 가지로 나뉜다.

일하는 방식의 변화도 공유했다. 사내 업무 시스템·AI 서비스 개발·서비스 아키텍처 모니터링에 AI를 도입하고 업무를 효율화하는 것이 골자다. 향후 다양한 업무에서 AI와 협업 가능한 수준으로 고도화할 예정이다.

정 CTO는 “카카오는 AI가 이용자의 일상에 자연스럽게 스며드는 'AI Native'를 목표로 하고 있다”며 “이를 위해 카카오 내부에서도 AI가 조직의 일부가 되도록 하는 것을 핵심 과제로 삼고 있다”고 강조했다.

이날 카카오는 엔비디아와의 파트너십도 발표했다. 엔비디아는 카나나 알파·엑스팀과의 협력하며 카카오가 AI 기업으로 변화할 수 있도록 지원 중이다. 엔비디아 추론 마이크로서비스(NIM)를 통한 AI 모델의 개발 및 배포, MLOps 플랫폼 구축, 지속적인 혁신을 지원하는 인프라 등을 지원한다.

타이 맥커처(Ty McKercher) 엔비디아 수석부사장은 “카카오가 한국뿐만 아니라 더 큰 AI 생태계를 만들어나가 글로벌 경쟁력을 갖추도록 지원하겠다”고 말했다.

손지혜 기자 jh@etnews.com

Menu

Kollo 를 통해 내 지역 속보, 범죄 뉴스, 비즈니스 뉴스, 스포츠 업데이트 및 한국 헤드라인을 휴대폰으로 직접 확인할 수 있습니다.