
“타란툴라 레이크하우스(Lakehouse)는 공공·민간의 인공지능(AI) 도입 과정에서 병목이 되는 데이터 인프라 구축 비용 문제를 해소하고, 우리나라가 AI 강국으로 도약하는 길에 디딤돌이 될 것입니다.”
김주섭 유엔넷 대표는 공공·민간의 AI 활용 확산을 전제로 “핵심은 데이터 인프라의 표준화와 비용 효율”이라고 말했다.
타란툴라 레이크하우스는 저장, 분석, 학습을 하나의 아키텍처로 통합한 구조다. S3 호환 오브젝트 스토리지에 오픈 테이블 포맷과 카탈로그를 적용하고, 트리노 쿼리 레이어로 일관성과 성능을 확보한다.
김 대표는 “스토리지와 컴퓨팅을 분리해 필요한 자원만 확장할 수 있어 총소유비용(TCO)을 줄인다”고 설명했다.
특히 보안·거버넌스 체계를 보안 요구가 높은 공공, 금융 환경에 맞췄다. 그는 “망 분리, 폐쇄망 설치, 전 구간 암호화, 키 관리, 접근제어, 감사, 데이터 계보 추적까지 가능하다”며 “민감정보 마스킹, 토큰화, 국산 암호모듈 연계도 지원할 수 있다”고 말했다.
레거시 시스템과 연계성도 고려됐다. 김 대표는 “기존 DB와 파일 서버를 비롯한 다양한 시스템과 유연하게 연동해 데이터 이관과 운영 부담을 최소화했다”고 덧붙였다.
AI 적용 단계에서는 학습 파이프라인과 연동을 전제로 했다. 피처 스토어 연계, 데이터셋 버저닝, 벡터DB 연동을 표준화해 도입 속도를 높였다는 설명이다.
그는 “타란툴라 레이크하우스는 공공이 요구하는 망 분리와 보안 요건에 맞춰 온프레미스 환경에 배포된다”며 “필요시에는 스노우플레이크와 연동해 클라우드 활용까지 확장할 수 있다”고 강조했다.
비용 절감 효과도 구체적으로 제시했다. 김 대표는 “기존 스토리지와 x86 표준 장비를 재활용하고, 계층형 저장 방식을 적용해 비용을 줄였다”며 “노드 단위 라이선스 모델을 채택해 데이터 인프라 운영 비용을 혁신적으로 절감할 수 있게 한다”고 말했다.
운영 단계에서는 데이터 품질과 신뢰성 확보에 무게를 뒀다. 그는 “컬럼 지향 포맷과 압축, 파티셔닝, 클러스터링을 적용해 저장 효율과 쿼리 지연을 낮추고, 캐시를 활용해 반복 조회 성능을 최적화한다”며 “데이터 품질 규칙, 서비스 수준 계약(SLA) 모니터링, 표준 배포 파이프라인으로 변경을 추적한다”고 설명했다.
김 대표는 “공공은 장비 조달, 보안 심사, 운영 인력 교육이 동시에 이뤄져야 한다”며 “표준 교육 커리큘럼과 운영 가이드, 자동화 점검 도구를 제공해 초기 정착 기간을 단축하겠다”고 말했다.
이어 “국산 플랫폼으로 지속 가능한 AI 인프라 생태계를 만들겠다”고 덧붙였다.
류태웅 기자 bigheroryu@etnews.com