"글로벌 빅테크 추격 넘어 틈새 전략 모색해야"
"AI 강국 도약, 독자 모델 없이는 불가능"
[서울=뉴스핌] 김신영 기자 = 대한민국이 '소버린 AI(주권형 AI)'라는 화두와 마주하고 있다. '소버린 AI'란 특정 국가의 기술과 데이터, 인프라를 기반으로 독자적인 인공지능 역량을 구축함으로써 외국 빅테크 의존에서 벗어나 인공지능(AI) 주권을 확보하자는 개념이다. AI 시대의 새로운 산업 주권이자 국가 경쟁력의 핵심 열쇠인 셈이다.
이재명 정부는 출범 직후부터 소버린 AI를 핵심 국정과제로 삼아 그래픽처리장치(GPU, Graphics Processing Unit) 5만 장 확보, 독자 파운데이션 모델 개발, 100조 원 규모 투자 계획 등을 잇달아 내놓으며 본격적인 정책 드라이브에 나섰다. 정부의 청사진은 야심차지만, 글로벌 빅테크와의 격차를 좁히는 동시에 국내 산업 생태계 전반에 AI를 확산시켜야 하는 과제가 주어졌다.
특히 데이터 주권 확보, GPU 인프라 구축, AI 스타트업 투자 활성화 등은 산업 현장에서 가장 절실하게 제기되는 문제다. AI를 국가 차원의 전략 자산으로 삼겠다는 구상은 명확하지만, 이를 지속 가능한 산업 경쟁력으로 연결하기 위해서는 정부 정책과 기업 현장이 긴밀하게 맞물려야 한다는 의견이 나온다.
이에 뉴스핌TV '이슈터미네이터'는 정책과 산업 현장이 만나는 접점을 모색하기 위해 전문가들을 초청했다. 한국인공지능소프트웨어산업협회 안홍준 AI산업본부장과 SK텔레콤 AI Model Lab 이태훈 팀장이 참여했다.
이번 방송에서는 ▲소버린 AI의 필요성 ▲독자 모델 개발이 국가 경쟁력과 직결되는 이유 ▲데이터·인프라 부족을 돌파할 해법 ▲산업계가 직면한 현실적 고민 등을 짚었다. 정책과 산업 현장의 목소리를 함께 청취하며 한국형 AI 전략이 구호에 머무르지 않고 실질적 성과로 이어질 수 있을지 모색해봤다.
아래는 토론 내용 전문이다.
▲이경태 뉴스핌 최고기술책임자(CTO) : 안녕하세요. 경제 사회 이슈를 최종적으로 법안으로까지 연결될 수 있도록 논의하는 이슈 터미네이터 시간입니다. 저는 진행을 맡은 이경태입니다. AI 관련해서 많은 이야기들이 나오고 있고 이재명 정부들어서도 다양한 정책들을 펼쳐 나가겠다고 계획도 내놨고 예산 계획까지 내놨는데요. 특히 소버린 AI 관련해서 많은 이야기가 나왔습니다. 소버린 AI는 우리나라의 AI 주권을 찾겠다는 부분인데 이와 관련해 앞으로 펼쳐질 정책과 방향성들이 좀 더 좋은 방향으로 나아갈 수 있도록 오늘도 이야기를 한번 나눠 보도록 하겠습니다. 전문가들을 좀 모셔봤는데요. 안홍준 한국 인공지능소프트웨어 산업 협회 AI 산업 본부장님 모셨습니다. 안녕하세요
▲안홍준 본부장 : 네 안녕하십니까
▲이경태 뉴스핌 CTO : 이태훈 SK텔레콤 AI MODEL LAB 팀장님도 오셨습니다. 안녕하세요. 반갑습니다. 그동안에는 정부 파트라든지 정치 파트라든지 그리고 이제 그 학계 이쪽 연구계 쪽에 대한 이야기들을 나눠봤거든요. 가장 바쁜 영역이 결국 산업계가 아닐까라는 생각이 들거든요. AI를 그냥 개발하는게 아니라 AI를 어떻게 활용해서 또 수익 창출하고 국가 경쟁력을 키워 나갈까 이런 부분인데, 일단 본부장님 뭐 협회 이름이 좀 변경된 거 같은데 맞습니다. 간단하게 소개 부탁드립니다.
▲안홍준 본부장 : 네. 한국 소프트웨어 산업 협회로서 저희가 한 35년 정도를 계속 그 유지해 오다가 올해에 초에 한국 인공지능 소프트웨어 산업 협회로 바뀌었습니다. 이 너무 길죠. 15자입니다. 영어 약자로 이제 코사라고 불러 주시면 될거 같고요. 한국 소프트웨어 산업 협회는 아주 오랫동안 그 한국의 소프트웨어 산업 특히 아 여러 이제 ICT 분야에서 다양한 역할을 해오고 있었습니다.
정책을 개발하고 정부에 건의한다든지 인력을 양성해서 산업계에 공급한다든지, 글로벌 해외 진출을 높기 위해서 여러 가지 다양한 판로를 개척한다든지 뭐 이런 여러가지 다양한 역할을 좀 해오고 있었는데 소프트웨어라는 이름만으로는 AI를 감당하기 어렵겠더라고요.
지금은 세상 모드가 다 AI를 외치고 있습니다. 기존의 소프트웨어 산업의 안에 카테고리 하나로 AI라는 인식을 갖고 있어서는 도저히 큰 흐름을 헤쳐 나갈 수 없겠다라고 판단해서 한국 인공지능 소프트웨어 산업 협회로 바꿨습니다.
▲이경태 뉴스핌 CTO : 최근에 어떤 방향으로 SK텔레콤이 AI를 이끌고 가는지 간단하게 설명 부탁드립니다.
▲이태훈 팀장 : 저희는 SK텔레콤 대표 파운데이션 모델을 직접 개발하는 조직이고 밑단부터 개발해서 각 분야의 응용까지 저희가 책임지고 개발하고 있습니다. 사내 애플리케이션뿐만이 아니라 그룹사 전체에 확산하는 것을 목표로 하고 있고 그룹사에서 효용성이 검증되면은 그것을 전 국민 전 계층으로 확산하고자 하는 것이 저희 조직의 목표이고요. 아직은 효용성을 검증하는 단계 정도라고 봐 주셔야 될 거 같은데 앞으로도 열심히 개발해서 전국민이 모든 혜택을 보실 수 있도록 열심히 개발하겠습니다.
▲이경태 뉴스핌 CTO : 그러면 언제 정도 좀 윤곽이 나올까요?
▲이태훈 팀장 : 최근에 독자 파운데이션 모델 사업이 시작이 됐고 그것의 1차년도 평가가 올해 말 있습니다. 일단 전국민이 혜택을 본다라기보단 일단 사용부터 먼저 해 볼 수 있는 기회가 연말에 생길 것 같은데요. 그 때 한번 써 보시고 여러 가지 의견들 주시면 반영해서 개발해도록 하겠습니다.
▲이경태 뉴스핌 CTO : 네. 그 최근에 말씀하신 것처럼 독자 파운데이션 모델 프로젝트가 진행이 돼서 최종적으로 다섯 개 팀이 컨소시엄 개념으로 해서 여러 기업이나 뭐 학계도 포함이 돼 있는 걸로 알고 있는데 결론적으로는 다섯 개 파트겠죠. 팀이 이제 경쟁을 하게 되는데 그게 그렇게 결정이 됐잖아요.
이게 이재명 정부 들어서 소버린 AI 관련돼서 첫 번째 어떤 프로젝트가 아닐까라는 생각이 들거든요. 그래서 근데 이제 소버린 AI라는 부분에 대해서 그동안 방식에 대해서 생각들이 많이 달랐고 아직도 완벽하게 굳어졌다라고 보기는 어렵잖아요. 그래서이 부분에 대해서 좀 어떻게 좀 생각하고 계시는지 본부장님께서 말씀 부탁드립니다.
▲안홍준 본부장 : 논쟁이 좀 있었습니다. 사실은 과연 소버린 AI를 통해서 우리가 얻어낼 수 있는 것이 무엇인가를 먼저 좀 먼저 찾아봐야 된다. 두 번째는 과연 소보린 AI가 가능할 것인가? 우리나라의 현실에서 뭐 여러 가지 이제 이런 그 논쟁들이 많이 있어서 어 참 고민을 많이 해했던 부분이죠.
그러나 저희 업계 전반적인 의견을 한번 모아보고 저희 협회에서는 나름대로 소버린 AI는 필수적이다라고 생각을 하고 있습니다. 한국이 AI 강국으로 도약해야 되는 것이 맞느냐부터 질문을 좀 해야 될 것 같아요. 앞으로 우리 이제 전 세계적으로는 AI라는 어떤 그런이 시대의 엄청나게 큰 흐름 이제 정보 혁명에 이어서 가장 큰 흐름은 이제 AI 혁명이라는 것이 뭐 거의 지배적인 의견이지 않습니까?
그러면 이제 우리나라는 그 흐름에서 벗어나야 되는 것이냐 아니면은 한 중진국 정도로만 머물면 되지 꼭 강국까지 될 필요가 있느냐라는 이제 또 의견도 사실 있긴 하더라고요. 우리나라가 강점을 갖고 있는 제조업 분야에서 앞으로 대부분의 기반이 AI로 바뀌어지는 상황에서 AI 강국이 되지 않으면은 우리는이 AI 강국의 어떤 하나의 하청국 뭐 OEM 정도 하는 그 정도로 또 중진국 수준을 머물 것인가 아니면은 좀 선도하는 위치에 올라갈 것인가라고 이제 질문을 한다면 과연 그 AI 강국이 절실한 것이냐 아닌 것이냐 아마 답을 내릴 수 있을 것 같고 그렇다면 꼭 독자 파운데이션 모델을 갖고 있어야만 AI 강국인 것이냐 또 이런 또 질문이 이제 2단계 질문이 나올 수 있겠죠.
독자 파운데이션 모델이 없는 국가에서 과연 AI 강국 틈 사이에서 표준을 먼저 재창하고 어떤 기준을 제시하고 할 수가 있을까라는 생각이 좀 듭니다. 가장 중요한 것이 기술 표준. 특히 이제 안전 윤리와 관련해서 이제 보이스를 내고 전 세계적에서 상당한 수준의 그 영향력을 좀 행사해야 강국이라고 볼 수 있는데 독자 파운데이션 모델이 없는 국가에서 외국에서 만들어 놓은 그런 그 빅테크들의 그 모델들을 따라가는 입장에서 우리가 강국의 그 면모를 보여 줄 수 있을까? 싶습니다.
▲이경태 뉴스핌 CTO : LLM 개발에 동참하신 SK텔레콤에서 이제 실제 업무를 보고 계시는데 결국은 소버린 AI에 대해서는 대찬성인가요?

▲이태훈 팀장 : 해야 한다는 당위성에 대해서는 정말 감사하게도 정부에서도 공감대를 가지고 선언을 해 주신 것과 다름 없기 때문에 저희 같은 개발 조직에선 조금 더 소명을 덜하면서 본업에 집중할 수 있는 환경이 조성이 된 거 같아서 참 다행인 거 같고요. 해야 하는 이유에 대해서는 저희는 그 명확하다고 보긴 하거든요.
일단 크게 보면 다운사이드의 리스크를 줄이는 방향과 업사이드 포텐셜을 강화할 수 있는 방향 두 가지 관점에 대해서 둘 다 우리 스스로의 모델을 만드는 것이 중요하다라고 내부적으로 좀 의견을 보고 있는데 예를 들어서 비용이 가장 대표적인 이슈일 것 같습니다. 약간 아직은 상상이긴 한데 이게 지금은 빅테크의 모델들이 규모의 경제로 비용 효율적인 서비스, 일단 품질은 차치하고서 비용부터가 압도적으로 차이가 많이 나기 때문에 많은 기업들 입장에서는 굳이 우리가 이만큼 돈을 들여서 투자를 해야 하는 것이냐 그냥 지금 값싼 거 선택하면 되는 거 아니냐라는 챌린지를 많이 하시는 거 같습니다.
근데 이제 지금은 비용이 싼 것처럼 보일 수 있지만 예를 들어서이 경쟁 업체들이 하나 둘씩 사라지고 예를 들어서만 남아서 전국민이 GPT만 쓰는 상황에서 갑자기 비용을 10배 100배 올리면 저희가 다른 선택지가 없는 상황에서는 그냥 받아들여야 되는 거거든요. 그래서 결국에는 단기적으로 비용이 덜 들어갈 것 같았던 옵션이 장기적으로 보면 더 비용이 많이 발생할 수도 있다. 그런 관점에서 비용을 줄이는 방향에서도 저희는 반드시 우리나라의 모델이 필요하다라고 보고 있고
그리고 좀 SF적인 상상이긴 한데 예를 들어서 중국의 AI가 탑재된 중국의 로봇이 우리 곁에서 모두 다 같이 일을 하고 있는데 갑자기 중국과의 관계가 악화돼서 우리나라에만 소프트웨어 업데이트를 제한한다라든지 아니면 좀 더 소설 쓰자면은 SF적으로 한국인은 적이야라고 업데이트를 해서 갑자기 한국인을 친다든지 아니면 나사를 조립해야 되는데 그중에 한 개를 일부러 느슨하게 한다든지 뭐 그런 상상도 해 볼 수 있을 것 같고요. 또 많은 분들이 말씀하시는 게 뭐 독도는 누구 땅이야? 아니면 고구려는 어느 나라 역사야? 그런 거를 물어볼 때 우리나라의 모델만이 그것을 사실을 정확하게 전달할 수 있다. 그런 말씀도 많이 하시는 거 같습니다.
실제로 알리바의 퀀이라는 모델을 기반으로 만든 퀀을 써 보면은 진짜 무서운게 고구려는 어느 나라 역사라고 한국말로 물어보면 한국의 역사라고 대답을 해 줍니다. 근데 그것을 중국어로 물어보면 중국의 역사라고 대답해 줍니다. 영어로 물어보면 분쟁 지역이라고 말합니다.
그게 굉장히 무서운 포인트이거든요. 자기들이 답변을 컨트롤 한다는 그런 상황을 이제 기술 위협이라고 보고 있고 그거에 대한 대응을 하려면 우리나라의 기술로 만든 우리나라 모델이 반드시 필요하다. 뭐 이런 다운사이드를 줄이는 방향에서 좀 당의성을 말하는 측면도 있을 것 같고요. 네. 그리고 업사이드에서는 당연히 이것도 역시 비용인 거 같습니다. 우리나라 사람들이 우리나라 컨텍스트를 이해하고 우리나라 만의 최적화된 모델을 만들어야 그것이 비용 효율성까지 연계된다라는 주장이고요.
실제로 저희 SK텔레콤에서는 토크나이저라고 하는 그 문장을 LLM을 이해할 수 있도록 작은 단위로 쪼개는 그것을 한국어의 특화해서 만들었기 때문에 실제로 GPT보다 같은 문장을 입력했을 때 더 비용 효율적으로 처리를 할 수 있는 그런 모델을 이미 만들었고 공개를 했습니다. 그래서 그렇게 우리가 우리 말을 이해한 상태에서 만들어야 실제로 비용 효율성까지 연결이 된다. 그렇게도 볼 수 있어서 그 당위성은 사실 저희는 당연하다고 보고 있고 우리가 어디까지 해야 우리 모델이라고 할 수 있는 것인가 그런 것도 참 논쟁 포인트인 거 같습니다.
다른 얘기긴 한데 소고기는 우리나라에서 6개월만 키워도 국내산이라고 하잖아요. 예. 근데 이제 유독 AI 분야에 대해서는 데이터만 한국 데이터면 된다라든지 그게 아니라 구조도 바꿔야 된다라든지 그게 아니라 반도체까지 우리나라 꺼야 한다든지 그런 식으로 굉장히 많은 논쟁을 야기하고 있는데 중요한 건 밸류체인의 바틀랩을 누가지고 있느냐인 거 같습니다. 진짜 필요로 하는 업체의 그 기술이 지금 외산이기 때문에 문제인 거거든요. 지금 대표적으로는 반도체인 거고 그리고 모델로서는 중국의 오픈소스들인 거고 그래서 그런 것들의 바틀렉을 하나씩 우리 것으로 대체하는 것이 소버린 AI의 핵심이라고 저희는 생각을 하고 있고 실제로 저희 SK 그룹에서는 그 이만큼을 들여와서 이만큼을 추가하면 우리나라 국민들이 많은 혜택을 볼 수 없다라고 생각을 하고 그냥 오픈 소스 가져와서 튜닝을 하는 것이 아니라 AI 학습에 필요한 반도체도 만들고
그리고 데이터 센터도 건립하고 그것에 전기도 용수도 공급하는 그런 진짜 AR을 위한 풀스택을 SK 그룹이 전부 다 그 힘을 합쳐서 준비를 하고 있기 때문에 그것이 저희가 생각하는 소리 AI의 정의에 조금 더 가깝지 않나 그렇게 생각을 하고 있고요. 그 동안에도 이야기를 나눠봤지만 그 소린 AI 얘기에서는 방금 말씀하신 것처럼 자체만 가지고 평가하긴 어려울 거 같아요. 그러니까 어떻게 보면 생태계 구축인데 그게 잘 돌아갈 수 있게끔 하는 부분인데 뭐 예를 들면은 그 예전에도 다른 분은 만나서 얘기할 때 그런 얘기를 하거든요. 그 누리오 관련해서 이야기를 AI 관련해서 얘기할 때 누리호도 얘기를 좀 하거든요. 누리호가 독자적인 한국 기술로 거의 대부분 거의 90몇 % 이상 100% 가깝게 독자 기술화해서 만든 최초의 그 대한민국 발사 체인데 거기도 보면 그 각각의 뭐 이렇게 탑재체부터 시작해서 엔진부터 시작해서 각각 그 중소기업까지 연계돼 갖고 하나를 만드는데 연결되는 그 부품들까지 국산화돼서 만들어서 이게 우리다라고 하는데 그건 그중에 외산을 쓸 수도 있는 거죠.
결국 할 수 없지만 근데 그렇게 만들어 가지고 그 우리 독자적인 걸 올리고 싶을 때 특정 무게를 넣어서 쏘아 올릴 수 있는 어떤 그런 선택의 기회가 있다라는 부분에서 강조를 많이 하더라고요. 놀이와 관련해서 AI도 그런 개념일 수 있겠다 싶은 생각이 드는데 좀 공감하시나요?

▲안홍준 본부장 : 팀장님 말씀 주셨던 것처럼 누가 칼자루를 쥐고 있느냐. 결국은 그 소버린 AI냐 주권형 AI냐 이거에 대한 그 기준이 되는 것이지 그러니까 엔비디아가 우리한테 반도체를 팔고 싶어서 난리를 칠 때가 그때 이제 우리한테 주도권이 있는 거다. 말씀하신 대로 모델도 우리 모델이 좋은 모델들 혹은 뭐 성능이 조금 우리가 그이 규모의 경제에 밀려서 조금 떨어진다 하더라도 적시적소에 많은 한국에서 많은 그 수요처에서 쓰고 있는 모델들이 많아지면 많아질수록 저희가 갖고 있는 주도권이 우리한테 발생하기 때문에 그게 소린 AI의 가장 본질이라고 보고 있습니다. 그래서 이렇게 소버린 AI를 독자적으로이 구축해서 해 나갈 경쟁력 개념이 좀 중요하다라는 생각이 들거든요.
일단 만들긴 만들었는데 다른 뭐 산업계로 이렇게 확장되는 경쟁력도 있지만 만들었다고 해서 이게다는 아니잖아요. 버전 1이 있을 거고 만들면 버전 1이 될 것이고 근데 버전 1을 썼는데 다른 데서도 빅테크 기업도 뭐 하루가 다르게 계속해서 업데이트를 하고 있잖아요. 우리도 그렇게 해 나가야 되는데 이게 유지 가능할까, 지속 가능할까 이런 부분에 대한 좀 의문을 갖고 계시는 분이 있거든요. 이거를 정말 계속 이어나갈 수 있을까? 이런 부분에 대해서는 좀 우려하시는 분들이 많거든요.
비용의 문젠인데 예를 들어서 지금 2030년까지 GPU 5만 장을 뭐 확보를 해 가지고 하겠다라는 부분이잖아요. 그걸 잘 활용하면 되는데 그럼 2030년 이후에는 어떻게 할 것인가? 정부에서 계속해서 돈을 쏟아 부어야 될 것인지 그거 거기에 대해서는 어떻게 버전업을 또 해서 계속 우리가 주도를 가지려면 우리 모델이 항상 최신으로 됐을 때 다른 모델과 비교했을 때 어느 정도는 서로 비교해서 우위에 있거나 비슷비슷해야 될 텐데 이걸 유지하는게 중요한 거잖아요. 그거에 대한 부분은 어떻게 생각하시는지 궁급합니다.
▲이태훈 팀장 : 미국과 중국이 투자하는 스킬 대비 우리나라가 사실 많이 부족한게 현실인 거 같습니다. 그래서 이 독자 A 파운데이션 모델 과제도 이전 과제명이 월드 베스트 LM이었거든요. 네. 세계 1등이라는 건데 그것이 조금 더 완화된 표현으로 독자 모델 개발이라고 바뀐 것이이에요
전 세계 사용자들이 원하는 테스크 100가지를 다 잘할 수 있는 모델을 빅테크가 만들고 있는 상황에서 우리가 그 100가지 평가 기준을 글로벌보다 전부 다 상회할 수 있을 것인가에 대해서는 많은 분들이 좀 우려 사항을 표현하고 계시는 거 같습니다. 저도 실제로 현업에 있는 사람으로서 그것이 가능할까라는 점에 대해서 의문점을 많이 가지고 있고요. 글로벌이 추구하는 모든 분야의 만능 AI 모델 그리고 크고 무거운 모델 그런 것을 정말 우리가 일대일로 붙어서 경쟁을 한다기보다는 우리만의 틈세를 찾아서 거기에서 1등을 하는 전략 아니면, 우리만의 데이터를 가지고 우리만 사용할 수 있는 모델을 만드는 전략 그런 것들이 조금 더 구체화 돼야 되는 시점이 아닌가 하는 생각이 있고요. 지금은 좀 초기 단계라서 아직은 그 불명확한 점들이 많이 있는 것 같습니다.
▲안홍준 본부장 : 저도 100% 동의합니다. 일단 처음에 챗GPT 열풍으로 인해서 범용 모델. 정말 막대한 정말 천문학적인 숫자가 들어가는 이런 AI 모델들을 봤을 때 우리는 사실 처음에 저희도 이제 나름 그래도 AI를 꾸준하게 열심히 해왔던 나라인데 이런 갑자기 이런 어마어마한 그 비용이 비용과 예산을 투입해서 만들어내는 AI를 보고 과연
우리는 쫓아가지도 못하겠다. 아예 쳐다보지도 말자. 사실 아주 잠깐 정도 이런 패배 의식에 사로잡힌 적도 있었습니다.
확실히 많은 분들이 전 세계에 정말이 똑똑하신 분들이 이야기를 만드신 분들기에 아주 다양한 방식과 기술을 계속 고안해내고 가지를 치고 가지를 치고 하는 단계에 좀 와 있다고 생각을 하거든요. 우리나라가 자신있게 지금 국가가 그동안에 약간 좀 소극적이셨던 정책에서 과감하게 지금 뭐 1조원을 투입한다. 1.5 조원을 투입한다라는 차원을 해서 말씀 주셨지만 월드 베스트 LM이라는 아 야심차한 용어까지도 잠깐 쓸 정도였으면 사실은 그런 자신감을 갖게 된 이유는 여러 가지 그런 다양한 지류들이 생기고 있다라는 그런 현상을 좀 반영한 거고요.
올해 초에 아무래도 이제 어 외산이긴 하지만 딥시크라는 그런 쇼크가 한번 있었지 않습니까? 왜 우리는 이런 이렇게 효율화하고 경영화된 모델을 효율적으로 만들려 그러지 않고 저 미국의이 큰 모델들만 보고 우리가 쫓아갈 수 있을까만 생각을 했을까라는 어떤 그런 그 경각심을 이끌어 준 또 하나의 계기였다고 또 봅니다.
그리고 기존에 이제 우리 또 AI 전문 기업들이 뭐 원래 준비하고 계시던 혹은 안 알려줬던 그런 개발 과정들이라든지 이렇게 또 계속 소개되면서 자신감을 갖게 된 거고 이제 독자 파운데이션 모델 다섯 개 팀이 이제 만들어졌습니다만 이미 경쟁력 있는 물론 규모적인 측면에서 성능적인 측면에서 아직은 더 쫓아가야 될 부분이 많지만 효율화 측면에서 굉장히 쓸모 있는 아주 특화된 분야에 쓸모 있는 모델들은 충분히 만들어낼 수 있는 영향이 있다는 걸 확인을 는 지능 과정에 있다고 봐야 될 거 같고요. 그래서
너무 지나치게 그 걱정을 하기보다는 어 충분히 지금 현재 글로벌 AI 어떤 이런 트렌드도 지나치게 초거대 범용 모델만이 성공하는 것이 아니라 특화 모델, 버티컬 모델들도 충분히 가능성이 있는 쪽으로 좀 가고 있다는 거를 좀 이해해 주시고 많이 응원해 주시는게 더 좋다고 생각을 합니다.
▲이경태 뉴스핌 CTO : 최근에는 뭐 GPT가 그 구글 정보를로 결국 학습을 해 가지고 이제 만들었다는 얘기도 막 나오고 있고 하거든요. 데이터인데 결국은 이제 좀 크게 봤지만 이제 뭐 AI 주권이보다도 데이터 주권으로 조금 낮출 경우에 이 데이터가 좀 잘 제대로 갖춰져 있어야지 모델이 잘 나올 텐데 이 부분에 대해서는 좀 어떻게 보시나요? 그러니까 기존의 이야기는 뭐냐면은 뭐 한글 데이터가 적다 이런 부분이지만 한글보다도 비정형 데이터도 상당히 많기 때문에 굳이 꼭 언어만이 해야 될 것인가라는 얘기도 있고 거기에 맞춰서 뭐 멀티모델까지도 확장되는 부분도 있거든요. 그 데이터 차원에서의 지금 그 정부 정책도 있지만 아 지금 요런 분위기에서 우리나라가 뭐 주권, AI 주권을 가져갈 때 이 데이터 주권을 어떻게 확보해야 될 것인지 이런 부분에 대해서 조금 혜안이 있다면 좀 말씀해 주시죠.
▲이태훈 팀장 : 일단 우리나라 말을 이해하는 모델은 외국인이 만들 수 있을까? 예를 들어서 정이 많다, 한이 많다. 효도를 한다. 이런 것을 영어로 번역을 하려면 할 순 있겠지만 굉장히 길고 비효율적으로 표현을 하게 될 것입니다. 그래서 그런 우리나라 말을 이해하는 모델을 만들려면 우리나라 컨텍스트가 담긴 데이터가 많이 있어야 된다. 그것은 좀 자명한 거 같고요. 근데 이제 그걸 넘어서 실제로 효용성 있는 AI를 만들려면은 산업이랑 연계가 돼야 되는데 그럼 우리나라 산업이랑 연계된 데이터가 많이 있어야 되는 거 아니냐. 그래서 아까 말씀하신 제조, 자동차, 철강, 반도체 등등에서 우리나라 강점이라고 알려져 있는 산업계들의 멀티모델 비정형 데이터들을 최대한 LLM이 학습할 수 있는 형태로 가공을 하고 정제를 하는 그런 활동들이 실제로 우리나라 대표 파운데이션 모델을 만드는데 핵심이라고 생각을 하고 있고요.
저희도 지금은 1단계는 다들 LM에 포커스를 많이 하고 계시는 거 같은데 점점 다른 컨소시엄도 마찬가지로 모달리티를 확장하고 규모를 키우고 그러면서 산업 연계를 강화하는 그런 활동들을 단기적으로 해 나가실 것 같습니다.
▲이경태 뉴스핌 CTO : 실제 팀장님 이제 멀티모델 쪽 더 확장해서 개발하는데 이제 신경을 쓰고 계신다고 들었는데 현장에서 데이터는 사실 다 데이터잖아요. 데이터할 수 있잖아요. 근데 뭐 기업이나 현장에서는 뭐 이 정도가 데이터가 되겠어라는 생각들이 많이 있는 걸로 알고 있어요. 그거를 데이터화할 수 있는 부분이 필요한데 데이터를 하려면 자금이 들어가야 되잖아요. 예. 뭐 센서를 하나를 만 설치한다 해도 돈이 들어가는 부분이어 가지고 그런 부분에 대해서 그러니까 뭐 SKT가 뭐 모든 걸 다 해 가지고 할 수 없는 부분이어서 그런 부분에서 정책적으로 좀 도움을 받을 수 있는 부분이 있을까요?
▲이태훈 팀장 : 실제로 이번 독자 모델 사업에서 데이터 제공도 굉장히 핵심적인 요소인 상황이고요. 그렇죠. 실제로 여기 자원도 많이 투입이 될 예정이고 그것을 한 컨소만 누리는 것이 아니라 공공에 개방을 한다든지, 전체 컨소시엄이 사용을 하게 한다든지 하는 방식으로이 과제 효용성을 극대화하려는 전략을 정부에서 제시하고 있는 거 같고요. 그리고 이 데이터가 LRM에 국한되지 않고 멀티모델, 뭐 비디오, 음성, 그리고 제조의 어떤 특화된 액션들까지 그런 것까지 모두 다 담겨야 되는 것이 아닌가 하는 아직은 좀 초기 논이 단계에만 있는 상황인 거 같습니다.
▲안홍준 본부장 : 예. 그 데이터 문제는 참 넘어야 될 산이 많이 있습니다. 확실히 그
사회자께서 정말 정확하게 지적해 주신게 앞으로 아주 크게 넘어야 될 산 중에 하나가 데이터 문제입니다. 이게 사실은 아직은 좀 많이 불편해하시죠? 우리 기업들에서 쓸 데이터가 없다. 뭐 여러 가지 다양한 그니까 데이터의 양도 뭐 적다고 얘기하시는데 실제로 양의 적은게 아니라 잘 정재돼 있는, 전 처리가 다 아주 깔끔하게 된 데이터가 적다는 거죠.
그러면 어쨌든 막 그 로데이터를 비정형 데이터든 정형 데이터든 갖고 와서로 데이터를 갖고 와서 어 전처리하는데 비용이 또 어마어마하게 들고 그걸 또 이제 쓰려면은 저작권 문제 해결해야 되고 여러 가지 다양한 개인 정보 문제 해결해야 되고 다양한 어떤 그이 과정이 있기 때문에 기간도 많이 들고 비용도 많이 들고, 우리도 많이 투자할 수 있어라고 했는데 또 데이터 처리할 수 있는 인재도 부족하고 아주 굉장히 고민을 많이 하고 계시는 분들이 있습니다.
그래서 저희는 기업분들한테 그런 얘기를 많이 듣습니다. 공공 데이터는 제가 보기에는 분명히 아주 활성화될 가능성이 있다고 봅니다. 정부에서 정말 의지를 갖고 어 공공 데이터를 좀 개방을 약간 좀 미온적으로 어 생각하는 어떤 그런 분들한테도 상당한 수준의 어떤 인센티브도 드리고 하면서 얼마든지 이거는 활성화할 수 있는 가능성이 있다고 생각하는데 민간 데이터 어떻게 모을 것이냐 결국은 거래를 활성화시켜 줘야 된다는 생각입니다.
데이터 보유한 기업에서도 혹은 뭐 기관에서도 우리 데이터가 수익이 될 수 있네라고 하는 그런 측면을 좀 활성화 해 주는 그런 역할을 좀 해 줘야 데이터가 필요한 AI 기업도이 정도의 가격을 지불해도 충분히 그동안 우리가 막 그 엉성하게 모여 있는 데이터를 모아 갖고 우리가 자체적으로 비용을 투자해서 하는 거보다 훨씬 더 가성비 있는 거래 시스템을 이용하면 그게 훨씬 더 좋지 지 않겠느냐.
그리고 굉장히 데이터를 내놓기를 그 싫어하고 어려워하는 기업들이 굉장히 많이 있습니다. 근데 그들한테도 비전을 보여 줘야죠. 아 우리가 갖꾸 있는 데이터가 굉장히 이게음 나름의 어떤 캐시카우가 될 수 있겠네라고 하는 어떤 그런 것들 계속 주면서 자꾸 거래를 활성화시켜 주는 그런 정책들도 필요하다. 이제 많은 기업분들이 이런 생각을 좀 하고 계시고 우리나라는 왜 유명한 데이터 거래 업체가 없느냐?
예. 해외에는 그렇게 많이 있는데 AI 뭐 허브 뭐 이런 식으로 해서 하게 있긴 한데 그게 기업들이 생각하는 그렇게 활성화된 그 양질에 못 많은 그 데이터를 지금 갖고 있느냐 이런 거 볼 때는 조금 의무를 제기하는 분들이 꽤 있거든요. AI 허브는 거기에 만약에
들어와 있는 데이터라면 굉장히 만족도가 높아요. 우리 기업들은 거기 안에는 전문 건부들이 모여 갖고 정제를 다 해서 정말 내려받아서 쓰기만 해도 되는 그래서 너무 만족도가 좋은데 적죠. 양이 적은 거죠. 비싸지 않나 하신 분들 비싸고 적다라는 부분이 있고.
비싸다고 표현하시 그 생각하시는 분들도 계시겠지만 이 정도 가격을 지불 해도 정말 가성비 좋다라고 생각하는 기업들도 있기 때문에 어쨌든 뭐 그런 시도 자체는 뭐 나중에 뭐 어떤가 데이터 가치를 어떻게 평가한다든지 이런 부분은 조금 더 어 논의의 그 세부적인 논의의 대상이겠지만 아예 지금 시도 자체가 지금 현재는 좀 미온적이라서 이런 것들은 계속 좀 개발해 나가야 될 필요가 있다.
그래서 예전에는 그 라인이 돼 있는 제조 업체일 경우에 어 일단은 원가를 낮춘 다음에 물건을 잘 만들어서 부량률을 줄이고 그다음에 원가 잘 만들어서 잘 판매해서 수익을 얻어 얻어서 원가를 원가 대비 마진이 높으면 수익이 되는 거잖아요. 근데 지금 상황에서 AI 데이터를 간다면은 여기는 그냥 플러스 알파가 되지 않을까라는 생각이 들거든요.
데이터 그 과정에서의 데이터는 뭐 다만 여기도 이제 원가 뭐 가공 뭐 전 처리를 한다든지 가공되는 데이터 가공에 들어가는 비용이 있겠지만 근데 이 자체만으로 얼마만큼의 돈이 될 것인가라는 부분에 대해서 뭔가 이렇게 눈에 보이는 손에 잡히는 뭐 그런 비전이 업체 입장에서는 그러니까 데이터를 내놓기 꺼려하는 입장에서는 그럼 얼마나 되겠느냐라는 생각 때문에 굳이 그것까지 지금 하는 것도 힘든 바쁘고 힘든데 내놓는 는 일까지 우리가 신경을 써서 얼마나 벌어드릴 수 있을까라는 거에 대한 확신이 안 되면 이게 안 나올 것 같은데 보이 그니까 그 논의를 시작해야 되고요.
그 정말 정확히 시작해 주셨는데 그 논의를 시작을 하고 여러 가지 정부에서도 이제 그런 뭐 시범 사업들을 계속 이제 좀 이렇게 발굴를 해 나가면서 어 산업 AX가 또 가장 큰 화두인데 산업 AX에서 가장 기본적으로는 산업 그 버티컬 데이터들을 모아 놓는 거거든요. 그리고 어떻게 잘 정제된 데이터를 모아 놓을지 이런 것들에 대해서 그림을 좀 그려 줘서 데이처 수요처와 데이터 공급처가 그 내용을 갖고 만나서 머리를 맞대는 어떤 그런 자리와 그 다음에 그 그런 그림이 필요하고 중간에 그 역할 해 줄 업체들의 역할도 분명히 필요하다는 겁니다.
그니까 데이터 유통업체들도 거기 과정에서 시장을 또 새로 생성할 수 있는 데이터 시장을 새로 생성할 수 있는 그런 생태계를 만들어 놓는 그림을 그려야지 뭐 억지로 강제로 내놔라 뭐 그동안에 그게 있었잖아요.
▲이경태 뉴스핌 CTO : 데이터 바우처 사업이라고 해서 이게 뭐 상당히 긍정적으로 잘 뭐 진행이 됐지만 어 소문에 의하면은 결국은 뭐 짜고 치는게 아니냐 그러니까 서로
필요에 의해서 내놓는 기업과 그걸 가져가는 기업이 사전에 이제 이야기 나눈 다음에 거기만 활용했지. 다른 기업이 활용할 수 없는 그런 데이터라는 개념에서 그때 그게 한번 내놨을 때는 한 기업만 매칭되는게 아니라 맞습니다. 엄청 많은 기업들이 매칭이
되면 그게 훨씬 더 좋은 건데 그게 잘 안 돼 가지고 데이터 바우처 뭐 그런 사업이 뭐 그렇게 엄청나게 그걸로 인해서 뭐 성공을 했다라는 그런게 잘 안 보여서
▲안홍준 본부장 : 저는 좀 다를 거라고 봅니다. 지금 AI 시대에 이제 접어들었기 때문에 그때는 생성형 AI의 시대가 아니었습니다. 예그 여러 가지 데이터를 활용하는 여러 가지에 뭐 용처들이 있었지만 지금은 그때랑은 완전히 좀 차원이 다를 겁니다. 그래서 데이터 바우처 사업을 계속 진행하자는 얘기가 아니라 지금 AI 시대에 맞는 데이터 거래 구조를 어떻게 만들 수 있을 것인지 그림을 그리고 어 새로운 시도들을 해 봐야 된다라는 것이 이제 우리 어깨 의견인 거 같습니다.
▲이경태 뉴스핌 CTO : 그 민간 기업 입장에서 데이터를 많이 확보해야 되잖아요. 어, 어느 방향으로 그런 좀 확보를 지금 하고 있나요
▲이태훈 팀장 : 일단 지금 상황으로는 구매를 많이 의존하고 있습니다. 고품질의 도서라든지 고품질의 기사들 그런 것들을 실제로 비용을 지불하고 구입을 하고 있는 상황이고요. 아까 말씀하신 그런 데이터 거래 플랫폼 같은게 있으면은 그런 것을 적극적으로 활용해 볼 수도 있을 것 같다는 생각인데 아직까지는 말씀하신 대로 좀 활성화가 부족한 상황이지 않나 싶고
그런 활성화가 조금 더 그 촉진되려면 규제도 사실 얘기를 안 할 수가 없을 것 같습니다. 의료 데이터 의료회의를 만들고 싶은데 이게 의료는 개인정보잖아요. 그래서 애초에 모을 수가 없고 모으는 거 자체가 불법이고 우리나라에서는 그리고 국방 같은 경우에는 그거로 우리의 공공 모델을 만들어서 뭐 해외에 수출한다거나 이런 시도 자체를 부정적으로 생각하시는 분들도 많고 제조의 현장 같은 경우에는 본인들 숙련자의 노하우라고 생각을 해서 데이터화 하는데 좀 거부감을 느끼시는 분들도 많고 그래서 그런 규제와 여러 가지 제약들 그런 것들을 현실적으로 적으로 좀 우리나라 실정에 맞게 풀어내는 것도 중요한 숙제인 거 같습니다.
▲이경태 뉴스핌 CTO : 한 가지 아이디어 개념인데 그 우리 이제 그 K팝 인기잖아요 전 세계적으로팝 보면 이젠 그 음원이 많이 팔려 가지고 하는데 어 예전 음악도 그 불러 나와 가지고 옛날 아파트 관련된 윤수일인가요?
아파트가 다시 와 가지고 또 사람들도 많이 들려지고 해서 음원 개념 보면은 작곡자나 뭐 작사자 해 가지고 하는데. 어 옛날에 했다 하더라도 다시 또 음원에서 소비가 되면 또 수익이 나는 개념이어서 수익이 또 이렇게 나눠지잖아요. 데이터가 정말 지금 어떻게 모으는 개념에서 그 쉽지 않은데 특히 바이오 관련해서는 저의 바이오 관련된 데이터가 뭐 찾아보면 상당히 많을 거 아니에요. 근데 그거를 의문 개념처럼 뭔가 이렇게 어디에 넣어서 그게 활용됐을 때 거기에 대해서 사용료가 부과돼서 수익화돼서 돌아온다면은 그런 부분에서는 개별 개개인도 거기에 대해서 동의할 수 있지 않을까 생각이 좀 들거든요
▲안홍준 본부장 : 아 실제로 그런 논의를 지금 하고 있습니다. 이제 정부 부처 간에도 이제 그 저작권 데이터 저작권과 관련된 이제 보호 정 정 정책을 이제 문채부에서 많이 하고 계시고 그다음에 이제 AI 산업 데이터 산업 육성 관련해서는 이제 과기정통부가 하고 있는데 실제로 그런 논의를 좀 하고 있고 여러 가지 그 데이터의 어떤 가치들 그러니까 개인이든 아니면 지금 팀장님 말씀하시지만 뭐 도서 출판 기사 어 이런 데는이 단체가 명확히 있어 갖고요. 거기 저작권을 갖고 있는 단체가 있기 때문에 거기랑
협상을 하면 되는데 어 그러니까 웹크롤링을 하는 어떤 개인 블로그 데이터를 갖고 온다든지 여러 가지 다양한 데이터를 갖고 오기에는 지금 그게 주체가 없기 때문에 거래 주체가 없기 때문에 그러면 과연 어떻게 식별하고 나중에 뭐 예를 들어서 먼저 쓴 다음에 쓰고 후보상을 한다든지 선사형 후보상을 한다든지 아니면 아예 오트하웃을 걸어놓고 그래놓고 이제 여러 가지 다양한 그 협상을 할 수 있는 그 뭐 만든 데든지 뭐 여러 가지 방법은 있습니다.
아주 디테일한 부분에서는 조금씩 차이가 있는데 말씀 주신 것처럼 갖다 먼저 쓰고 보상 혹은 먼저 허락을 받고 써야 되는 데이터들은 어떤 것들이 있으며 이런 아주 구체적이고 그 디테일한 부분들은 좀 더 논의가 필요하지만 논의는 시작하고 있다 이렇게 보시면 될 것 같습니다.
▲이경태 뉴스핌 CTO : 그래서 개개인의 정보가 상당히 중요하거든요. 모서 턴을 보고 거기 안에서 새로운 가치를 만들어갈 때 비즈모델이 나올 수 있을 텐데 결국 개개인 자체 한 명 것도 못 가져오는 상황에서 그 예민한 정보일 경우에 근데 그거를 어 좀 어느 정도 예상 가능한 수익이 생긴다라고 할 경우에는 본인이 잡고 가는 것도 쉽지 않은 부분도 있고 그 뭐 알바를 많이 하잖아요 솔직히.
그 비용을 적은 비용으로 알바를 더 많이 하다 보니까 힘든 부분인데 데이터를 생상 생산하는 뭐 자기 어 뭐 왜 춤도 데이터가 될 수 있으니까 예를 들면 그니까 그런 부분에서 데이터 자기가 원하는 어떤 자기가 만들 수 있는 데이터를 뭐 주기적으로 판매할 수 있다라는 그런 시장이 개인화돼서 열린다면 초창기에 앱스토어가 1인 앱 개발 시장을 키웠듯이 그런 데이터 시장도 1인 데이터 시장을 키운다면 새로운 수익 창출 거리가 돼서 우리나라 사람들이 상당히 그거 잘하잖아요.
뭐 새로 새로운 아이디어로 그래서 그런 개념에서 좀 풀어 준다면은 좀 데이터를 확보하는 기업 입장에서도 그게 쉽지 않을까라는 생각이 좀 들어요
▲안홍준 본부장 : 다만 이제 그럴 것 같습니다. 이제 어떤 저작권이 있는 어떤 창작물의 경우는 그거를 직접 사용을 한다든지 아니면 그것을 열람한다든지 이렇게 되면은 상당 부분 비용이 발생하는데 AI의 데이터 학습용 데이터를 활용한다 그러면은 사실 그렇게 그 많은 비용을 이렇게 수익을 가져다 줄 순 있을까 아마 아마 그런 좀 걱정은 되는데 어쨌든 그런 개념 자체는 확장시켜 나가는 방법으로서는 굉장히 좋을 것 같습니다.
▲이경태 뉴스핌 CTO : 학습뿐만 아니라 출론형 출론 데이터로 활용할 때 곧바로 그거에 대한 데이터가 반응이 나오니까 거기에는 당장 그 어떤 가치가 나올거고 변화되는 값이 나오잖아요. 거기에 대한 수익 비즈 모델은 기업이 만들면 되고 거기 각각의 수익 모델이 나오지 않을까 이런 생각도 들거든요.
▲이태훈 팀장 : 네. 말씀하신 거 들어 보니까 유튜브가 떠오르긴 했습니다. 네. 콘텐츠 소비자와 콘텐츠 프로바이더를 연결해 주는 플랫폼을 유튜브가 하는 것처럼 데이터 거래 플랫폼이 있다면 기꺼이 자기 데이터를 내놓고 싶은 사람과 그것을 가져가서 활용해서 밸류를 창출하고 싶은 사람이 연결되는 그런 장터가 있으면 좋겠다라는 생각인데
참 제 생각이 쉽지 않은 거 몇 가지 말씀드리면은 효용성을 입증함에 있어서 그 사람의 요만큼의 데이터가 얼마나 어느 정도의 기어를 했는지 그것을 측정을 할 수 있어야 실제 수익이 발생했을 때 분배해서 나눠주는 구조가 만들어질 것 같습니다. 근데 이제 그런 포션을 산정하는 것이 지금의 기술로서 일단 AI 기술 관점에서 쉽지 않다. 그런게 하나가 있을 것 같고요.
예술 창작물에도 NFT를 매핑해서 거래하는 시도들이 많이 있었는데 이게 그런게 이슈였던 거 같습니다. 진짜 이게 내가 만든게 맞아. 이 데이터는 나의 오리지널리티가 있는 거 맞아? 그런 거를 본인이 확실하게 주장을 할 수 있어야 되는데 이 세상에 온전히 완전히 새로운 거 완전히 나만의 것이라는게 얼마나 있을까요? 내가 만든 데이터라고 할지라도 이것은 나의 상상으로 만들어졌지만 누군가의 어떤 주워 들은 말을 통해서 만들어진 데이터일 수도 있고 저작권이 명확한 거는 이슈가 없겠지만 그렇게 데이터 거래 플랫폼 같은 개념이 유튜브처럼 만들어졌다고 했을 때 누구나 개개인이 올릴 수 있는 그런 동기를 만들어 줘야 되는데 그렇게 무분별하게 본인 데이터를 올리는 상황이 만들어지면 진짜 그 데이터가 그 사람 거 맞냐? 그런 거를 입증할 수도 있어야 될 것 같습니다.
▲이경태 뉴스핌 CTO : 뭐 그런 입증하거나 증명해 줄 수 있는 또 장치를 좀 마련해. 그런 검증 시장이 좀 새로운 개념에서 활성화되지 않을까 그리고 새로운 일자리가 나오지 않을까 생각하거든요. 그래서 그 독자 어 파운데이션 모델을 이제 만들면서 현 정부에서 이제 시작을 했죠. 시동을 걸었는데 뭐 이젠 100조 시대 100조를 투입하겠다는 얘기도 있고 한데 이게 단순히 그냥 뭐 모델만 만들게 아니라 산업곳에 그리고 생활 곳곳에 이재명 정부의 또 선언 중에 하나가 이제 모두의 AI 부분이잖아요.
그거를 그냥 단순히 그냥 해석할게 아니라 산업에서도 각각에서 어떤 고객한테까지이 AI가 스며 들어갈 것인가 이거를 조금 고민하는게 필요하지 않겠나라는 생각을 하거든요. 그래서 그런 차원에서 좀 시간도 좀 됐고 해서 뭐 전체적으로 마지막으로 또 협회나 아니면은 SK 차원에서 어떻게 해 나갈 것인지에 대한 부분을 간단하게 하고 그리고 뭐 정부나 아니면 정치권 특히 이제 이슈 터미네이터 이 방송이 최종적으로는 법안으로 만들어서 할 수 있는 아이디어를 지금 제공해 주는 개념이거든요. 그렇다 보니까 그런 개념에서 네. 뭐 마무리 말씀 해주시면은 좋을 것 같습니다.
▲안홍준 본부장 : 뭐 그 고민을 하는게 이제 저희 역할입니다. 그래서 어 상당히 많은 고민을 하고 그다음에 그 고민도 뭐 한쪽으로만 보는게 아니고 굉장히 여러 가지 다각도로 좀 하고 있는 또 저희 그 역할이 있기 때문에 아니까 한 가지만 좀 말씀을 드리면 저는 지금 방향은 세정부가 우리 기업 전반적으로 보면은 되게 잘 잡고 있다라고 보고 있고 그다음에 사실 어떻게 보면은 그 그동안에 GPU 만장 구매한 한다라는 어떤 그런 정책과 어 독자 모델을 이렇게 또 개발한다.
조단위가 좀 넘어가는데 이 우리 이제 ICT에서 아주 이례적인 일입니다. ICT 분야에서. 그니까 확실히 AI에 대해서 관심이 많이 있고 이번에도 국정 기획위에서 발표한 자료를 보면은 경제 파티에서 제일 먼저 AI가 올라와 있더라고요. 그래서 참 AI 산업 종사자로서는 굉장히 좀 고무적인 일이고 방향성도 저는 뭐 소버린 AI를 계속 주창하는 분들을 주창하고 계시면 거기에 대해서 조금 의문을 갖고 있는 분들도 계시지만 분명히 시장 확대와 그다음에 얘기하셨던 산업에서도 AI가 확산된다는 것들을 굉장히 중요하게 생각하고 계시고
그 다음에 모두의 AI라는 개념 자체도 기본적으로 전 국민의 어떤 AI 리트러시가 확장이 시장도 크게 확장할 수 있는 거고 일단 내수에서 우리나라의 AI를 많이 쓴다 그러면 훨씬 그렇지 않습니까? 카카오라든지 네이버라든지 구글이라는 그런 공룡이 있음에도 불구하고 우리나라에서는 카카오 네이버를 더 많이 쓰기 때문에, 그런 성공적인 어떤 그런 그 사례도 있고 기본적으로 우리가 통신이라든지 여러 가지 인터넷 강국으로서 오 모바일 강국으로서 오랫동안 군림을 해 왔기 때문에 AI 부분도 마중물을 조금 더 부어 주면은 충분히 그 강국으로 갈 수 있다.
모두의 AI를 실현을 할 수 있다라 긍정적인 생각을 좀 하는데 한 가지는 조금만 더 그 좀 도와주셨으면 하는게음 뭐 정책적으로든 제도적으로든 우리나라 이제 AI 스타트업들이 좀 곤란한 경험을 좀 겪고 있는 것이 아주 야심차게 해서 성공적인 행보를 보이는 스타트업들만 우리가 언론상에서 봐서 그렇지 실제로 AI를 기반으로 해서 여러 가지 다양한 비즈니스를 해 보고자 하면은 너무 힘들합니다.
왜냐면 AI 기본적으로 돈이 많이 들어갑니다. 아시겠지만 AI로 창업을 하기 위해서 굉장히 돈이 많이 들어가기 때문에 결국은 투자 유치를 하는 것이 예, 가장 거의 사실상 유일한 그 시작인데. 그 우리나라 투자자들이 뭐 VC를 위시한 여러 투자자들이 아직은 AI 쪽에서 수익이 많이 발생하지 않고 있기 때문에 좀 더디지 않습니까? AI 비즈니스 자체가.
그렇기 때문에 이런 차원에서 조금음 망설린다든지 투자에 대해서 망설인다든지 조금 미온적이라든 부분이 있습니다. 그래서 스타트업들이 정말 활성화 돼야 되는데 정보에서 좀 모태 펀드 여러 가지 뭐 AI 혁신 펀드라고 해서 지금 뭐 한 예 600억 규모로 지금 하는 것도 좀 있고 근데 그것 더 커 더 커져야 된다고 보고요.
돈을 많이 투입해야 되는게 결국은 관건이지 않습니까. 그 방향은 잘 잡았더라도 거기에 투입되는 여러 가지 예산이라든지 이런 것들이 좀 부족하면 가다가 멈출 수 있거든요. 그래서 어 모태 펀드도 좀 많이 활성화시켜 주면 좋겠고 투자자들이 네 아 조금 안심하고 AI 사업에 대해서 투자할 수 있는 여러 가지 다양한 제도들 뭐 투자를 좀 그들의 동기 부여를 좀 이끌어낼 수 있는 어떤 그런 제도들 정책들 요런 것들이 조금 더 활성화되는 분위기를 좀 조성해 주면 그리고 우리 스타트업들은 결국은 아주 밀알 같은 존재들이기 때문에 그렇게 신경을 써 주셨으면 좋겠다 정도의 이제 말씀을 좀 드릴 수 있을 것 같습니다.
▲이경태 뉴스핌 CTO : 스타트업 얘기를 사실 하려다가 시간상 좀 빠뜨렸는데 잘 말씀하셨어요. 그래서 스타트업이 쉽지 않은 부분이어 가지고 아마 그런 부분에서의 정책 방향이나 뭐 정치권에서 법안 이런 것도 마련되면 좋지 않을까라는 생각이 들고요. 네. 뭐한 말씀 있으시면은
▲이태훈 팀장 : 100조라는 금액이 글로벌 빅테크와 비교해서 여전히 적은 금액처럼 보일 수도 있겠습니다만 뭐 우리나라의 여건상 사실 엄청난 투자라는 것은 누구나 공감하시는 부분인 거 같고요. 그렇게 많은 금액이 투자되는 과제인만큼 효용성이 실제로 입증이 되어야 하는데 이게 AI에만 딱 투자하는 것이 아니라 AI 생태계를 만들어 가야 되기 때문에 100조라는 금액이 필요한 것이거든요.
AI를 만드는데 필요한 데이터와 GPU뿐만이 아니라 그거를 활용해서 가져다 쓰는 사람들한테 바우처를 지급하고 그것을 만드는데 필요한 인프라를 확충하고 그것을 운영하는데 필요한 에너지를 조달하고 그런 것들에 모두 다 고르게 집행이 되어야 100조라는 금액이 의미가 있게 그리고 우리나라 산업을 이제 이끌어 갈 수 있는 그런 재반 환경을 만들어 내는데 더 도움이 되지 않을까 싶습니다.
뭐 이미 많이 정부에서 고민해 주고 계실 것 같긴 한데 그런 100조가 고르게 쓰였으면 좋겠다. AI를 영위하는 그런 전 산업에 걸쳐서 고르게 쓰였으면 좋겠다라는게 하나 있고요. 그리고 두 번째는 사실 많은 분들이 지적을 해 주고 계시는 건데 갈라파고스화되면 안 된다. 이게 우리나라 사람들이 만들어서 우리나라 사람들한테 효용을 주는 것까진 좋은데 우리나라 사람들까지만 효용이 되면 안 된다.
그러면 뭐 기존에 많은 실패를 답습하는 그런 사례일 뿐이다라고 말씀 많이 하고 계시는 거 같습니다. 실제로 이번에 독자 파운데이션 모델 사업의 목표가 글로벌 모델 대비 95%의 95% 수준의 성능 이다라고 목표를 설정한 거에 대해서 굉장히 많은 챌린지가 있었던 것을 알고 있는데 95% 하면 잘한 거냐. 글로벌 대비 잘하는게 하나라도 있어야 되는 거 아니냐. 뭐 그런 여러 가지 논란들이 있었던 거 같습니다. 그래서 갈라파고스화 되지 않기 위한 그 일종의 정책들 뭐 그런 것들이 아직 저도 구체화된 생각은 없지만 그런 것들을 좀 더 고민해서 정책에 반영해 주시면 좋지 않을까 그런 생각이 있고요.
이거는 이제 뭐 제가 개발자이자, 소프트웨어 엔지니어이자, 실무자 입장으로서 말씀드리고 싶은 건데 실패해도 괜찮은 분위기를 우리나라 전체가 좀 만들어 줘야 되지 않나 하는 생각이거든요. 소프트웨어 개발은 비용이 아니라 투자인데 비용이라고 항상 생각을 하시고 얼마 넣었으니까 얼마 벌어야 돼,이 정도까진 해 줘야 돼라는 관점으로 생각하시는 분들이 참 많은 거 같습니다.
그런 생각들을 이제 어느 특정 조직에서만 바꾸는 것이 아니라 정부에서도 기업의 경영진들에서도 뭐 국민들께서도 다 그렇게 생각을 좀 조금씩 강화를 해 주셔야 그런 우리가 실패해도 괜찮은 분위기, 스타트업들이 육성되고 거기에서 개발한 기술들이 다 폐기되지 않고 올바르게 쓰이고 그런 환경을 조성하는데 투자도 중요하지만 그런 분위기라는게 있잖아요.
예를 들면 R&D 예산 삭감 얼마 뭐 이런 것도 예산을 삭감했다라는 금액도 중요한 건데 분위기를 그렇게 형성해 버렸다는 거. 그런 것도 굉장히 중요한 포인트인데 R&D가 중요하다. 그리고 AI가 중요하다고 했으니까 AI 커머디티화 하는데도 예산을 쓰는 것과 더불어서 그것이 나오게 된 배경에는 우수한 선행 연구들이 있었기 때문이거든요.
지금은 트랜스포머라는 모델 1극 체제가 되어 있는데 그것을 중심으로 많이 제품들이 상용화가 되어 있는데 그런 거에만 몰두에서 이제 비용이 들어가는 것이 아니라 그것을 깨기 위한 다른 방법론들을 선행 개발하는 그런 연구 개발비에도 좀 많이 책정이 돼야 넥스트 제너레이션 AI를 우리나라가 끌고 가는데 좀 더 도움이 되지 않을까 생각이 돼서 그런 자원 조달 이런 것도 중요하지만 그런 정부가 나서서 분위기를 조성해 주면 그게 실무자 입장에서는 더 재밌게 일할 수 있는 동기가 되는 거 같습니다.
▲안홍준 본부장 : 실제로 정말 좋은 말씀 주셨는데 제가 저희 협회에서 근무하면서 계속 소프트웨어를 비용으로 생각하는 어떤 그런 분위기 실제로 뭐 여러 가지 정부 예산이라든지 이런 거 보면은요. 소프트웨어 개발비입니다. 그러니깐 제가 회계 전문가는 아니라서 개발 비용이라는 거는 그 한에 쓰고 날아가 버리는 거거든요. 그러니까 굉장히 악절감의 대상이거든요. 비용은. 근데 자산이라는 개념이 있어야 되거든요. 건물이라든지 이런 것들 보십시오.
그러니까 소프트웨어 시스템, 우리 AI 시스템 이런 것들 한번 구축이면 그거는 감가 상각으로 조금 조금조금씩 이제 잘라 나가면서 그건 내 재산인 거거든요. 그렇게 인식을 해야 이게 여기에 많은 투자는 비용을 쓰는게 아니고 절감해야 될 대상을 아껴 쓰려고 그런게 아니고 내 재산을 사는 거야. 이런 개념으로 바뀌어야 된다고 봅니다. 그 확실히 그런 분이 제도적으로도 그게 좀 예, 정착이 되는 것도 중요하다고 생각합니다.
▲이경태 뉴스핌 CTO : 그래서 이제 소버린 AI를 강조하지만 일단 LLM을 만들었다 해서 국한할게 아니라 넥스트 스텝에서 우리는 무엇을 어떻게 만들 것인지 그리고 산업과 국가 경쟁력을 어떻게 키워 나갈 것인지 이런 부분들에 대한 의문을 항상 갖고 가야 되지 않을까라는 생각을 하고요. 여기서 이슈 터미네이터 마치도록 하겠습니다. 감사합니다.
sykim@newspim.com