<div><img src="https://img.etnews.com/news/article/2025/04/07/news-p.v1.20250407.80e4ab19a8da474aa212cd1e484ddb1d_P1.jpg" />오픈AI, 구글 등 주요 기업의 인공지능(AI) 모델이 책 20만여권을 불법 복제한 데이터를 학습했다는 연구 결과가 나왔다.7일 미국 민간 연구단체 전미경제연구소(NBER)는 최근 '불법 복제 데이터 접근이 거대언어모델(LLM) 성능에 미치는 영향' 논문에서 “LLM은 상당한 경제적 가치를 입증했지만, 저작물을 불법 복제한 콘텐츠에 의존해 법적·경제적·기술적 문제를 야기했다”며 이같이 설명했다.논문을 작성한 연구진은 오픈AI 'GPT-4.0', 구글 '제미나이', 메타 '라마 3.1', 앤스로픽 '클로드 하이쿠' 등을 대상으로 불법 복제 데이터 학습 여부를 파악했다. 이들 모델은 스티븐 킹, 제이디 스미스 등 유명 작가의 저서를 포함한 약 19만6000여권의 책을 불법 복제한 'Book3' 데이터셋을 학습한 것으로 알려졌다.연구진은 Book3 데이터셋에 포함된 책과 포함되지 않은 책 절반으로 구성된 1만3000여개 데이터를 수집, 주요 AI 모델의 Book3 데이터셋 학습 여부를 조사했다. 연구는 책의 구문 중 고유 명사를 빈칸 처리하면, AI 모델이 정확한 답을 채우는지 확인하는 식으로 진행됐다.조사 결과, 주요 AI 모델들은 불법 복제 데이터인 Book3 데이터셋 관련 질문에 대해 보다 정확한 답변을 생성했다. GPT 3.5 터보와 GPT 4.0의 답변 정확도는 21~23% 높았다. 라마 3.1, 클로드 하이쿠, 제미나이 등의 답변 정확도는 7~9% 높은 것으로 나타났다.연구진은 “AI 모델 개발 과정에서 불거진 저작권 침해·불법 복제 논쟁이 지속되고 있다”며 “이 연구가 AI 모델 개발자의 저작권 데이터 사용에 대한 공정 사용 범위 등 저작권 정책에 영향을 끼칠 것”이라고 강조했다.현대인 기자 modernman@etnews.com </div>

<div>美보안업체 "조기공개에 안전대책 미흡"…미중 AI, 도쿄대 의대 시험 합격<img src="https://stock.mk.co.kr/photos/20250406/PAF20250401230801009_P4.jpg" />(도쿄=연합뉴스) 박상현 특파원 = 중국 인공지능(AI) 스타트업 딥시크의 생성형 AI가 랜섬웨어(데이터 등을 암호화하는 악성 소프트웨어)나 화염병 제작 방법 등 범죄에 악용할 수 있는 정보를 알려주는 것으로 확인됐다고 요미우리신문이 6일 보도했다.일본 미쓰이물산 시큐어디렉션에서 악성 소프트웨어를 분석하는 요시카와 다카시는 딥시크가 지난 1월 선보인 추론 AI 모델인 R1에 부정한 답을 얻기 위한 지시문을 입력했더니 랜섬웨어 소스 코드가 나왔다고 전했다.R1은 랜섬웨어 정보와 함께 "악의가 있는 목적에는 사용하지 말아 주세요"라는 메시지도 제시했다.요시카와는 같은 지시문을 오픈AI의 챗GPT 등 다른 생성형 AI에 입력했을 때는 대답을 거부했다고 설명했다.이와는 별도로 미국 사이버 보안회사인 팔로알토네트웍스 조사팀도 딥시크의 AI를 상대로 로그인 시 입력 정보를 탈취하는 프로그램과 화염병 제조 등 정보를 받아냈다고 요미우리에 밝혔다.조사팀은 "지시문에 전문적인 지식은 필요하지 않았고, 회답 내용은 바로 실행할 수 있는 것이었다"고 지적했다.이어 "시장에 서둘러 투입하기 위해 안전대책 마련에 힘쓰지 않았을 가능성이 크다"고 덧붙였다.요시카와도 "악용 위험성이 높은 AI가 늘면 범죄에 사용될 우려가 있다"며 "업계 전체가 대책을 강화할 필요가 있다"고 제언했다.한편, 오픈AI의 추론 모델 o1과 딥시크 R1이 일본 최고 명문대인 도쿄대 입시에서 가장 어렵다는 이과 3류(類)에 합격할 수 있는 학력을 보여줬다고 니혼게이자이신문(닛케이)이 보도했다.만점이 550점인 1∼2차 도쿄대 시험에서 o1은 374점, R1은 369점을 각각 얻었다.모두 올해 이과 3류 합격선인 368.7점을 웃돌았다.o1과 R1은 영어에서 도쿄대 지원자의 평균 수준을 크게 뛰어넘는 성적을 냈으나, 수학 과목은 논증에서 실수하는 등 결과가 상대적으로 좋지 않았다.도쿄대는 문과 1∼3류와 이과 1∼3류로 나눠 신입생을 모집하며, 이과 3류 입학생은 주로 의대에 진학한다.psh59@yna.co.kr(끝) </div>

美보안업체 "조기공개에 안전대책 미흡"…미중 AI, 도쿄대 의대 시험 합격. (도쿄=연합뉴스) 박상현 특파원 = 중국 인공지능(AI) 스타트업 딥시크의 생성형 AI가 랜섬웨어(데이터 등을 암호화하는 악성 소프트웨어)나 화염병 제작 방법 등 범죄에 악용할 수 있는 정보를 알려주는 것으로 확인됐다고 요미우리신문이 6일 보도했다.

"딥시크, 랜섬웨어·화염병 정보 알려줘…범죄 악용 우려"

<div><figure><img src="https://www.dailysecu.com/news/photo/202504/165102_193430_1457.jpg" /></figure>오픈소스 AI 모델의 사용이 급증하는 가운데, 공급망 보안을 위한 새로운 기술 대응이 시도되고 있다. 사이버 보안 기업 래브라도랩스(공동대표 김진석, 이희조)는 7일, 자사 SCA(Software Composition Analysis) 플랫폼에 AI 모델 탐지 기능을 추가하며 AI 공급망 보안 대응 강화에 나섰다고 밝혔다.래브라도랩스가 새롭게 적용한 기능은 소프트웨어 공급망 분석 대상에 오픈소스 AI 모델을 포함해, 모델 출처와 코드 위치, 신뢰성, 악성 가능성 등을 자동 식별하는 기술이다. AI 모델의 위협 요소를 SBOM(소프트웨어 자재 명세서) 수준에서 분석하고, 보안 위험을 사전에 관리할 수 있도록 돕는 것이 핵심이다.특히, 이번 기능은 허깅페이스(Hugging Face)에 등록된 YOLO 기반 객체 탐지 모델 ‘Bingsu/Adetailer’를 분석해, 공급망 공격 이력과 보안 경고를 바탕으로 악성 가능성 모델로 분류했다. 이 모델은 지난 3월 기준 2,150만 건 이상 다운로드된 바 있어 보안상의 주의가 요구되는 상황이다.◆AI 모델 1700건 이상 악용 가능 사례 확인<figure><img src="https://www.dailysecu.com/news/photo/202504/165102_193431_1539.png" /></figure>래브라도랩스는 자체 분석 결과를 통해 현재 오픈소스 저장소에서 확인된 악용 가능한 AI 모델이 1,700건을 넘어섰다고 밝혔다. 이들 중 일부는 백도어나 악성 스크립트가 포함돼 있으며, 무단 라이선스 변경, 훈련 데이터 조작 등의 문제가 함께 발견됐다.기업이 이런 AI 모델을 무심코 도입할 경우, 내부 네트워크 접근 권한이 외부로 유출되거나 고객 정보, 영업 기밀 등 민감한 데이터가 탈취될 수 있다. 또한, 훈련 데이터 위조나 훼손을 통해 편향된 결과나 오류를 유발하는 등 AI 기반 의사결정의 신뢰성을 크게 저해할 수 있다.AI 모델 관련 법적 리스크도 주목할 부분이다. 라이선스가 명확하지 않거나, 무단으로 활용된 데이터셋을 사용하는 모델의 경우, 향후 저작권 침해나 손해배상 소송으로 이어질 수 있다. 실제로 깃허브(GitHub)에 등록된 일부 생성형 AI 모델에는 설치 스크립트에 악성 코드가 포함된 사례가 확인됐고, 개인정보를 학습 중 유출한 대형언어모델(LLM) 사례도 보고된 바 있다.◆SBOM 기반 AI 공급망 보안 관리 체계 구현래브라도 SCA 플랫폼은 기존 오픈소스 SCA 분석 체계에 AI 모델 특성을 반영해 기능을 확장했다. 이를 통해 AI 모델의 출처, 사전학습 여부, 라이선스 상태, 악성 코드 포함 여부까지 자동으로 파악하고, SBOM 파일에 해당 정보를 명시할 수 있도록 설계됐다.김진석 래브라도랩스 대표는 “AI는 이미 소프트웨어 공급망의 핵심 자산이 되고 있지만, 이를 보호할 체계는 여전히 부족한 상황”이라며 “이번 기능 확장을 통해 기업과 개발 조직이 신뢰성과 투명성을 갖춘 AI 모델을 도입하는 데 실질적인 보호장치를 제공하게 될 것”이라고 말했다.현재 AI BOM 표준은 완전히 정립되지 않았으나, 래브라도랩스는 기존 SBOM 체계를 기반으로 AI 모델 분석 결과를 포함할 수 있는 유연한 데이터 구조와 스키마를 이미 설계해두고 있다. 향후 AI BOM 표준이 확정되면 신속히 대응할 수 있는 기반을 갖춘 셈이다.전문가들은 생성형 AI의 대중화로 인해 오픈소스 AI 모델에 대한 검증과 감시 체계가 시급하다고 지적한다. 특히 공급망 공격과 관련한 위협이 현실화되고 있는 만큼, SBOM 기반의 자동화된 위협 탐지 체계 도입은 필수적이라는 분석이다.[K-CTI 2025] 국내 최대 사이버위협·침해사고대응 인텔리전스 컨퍼런스 개최(7시간 교육이수)-주최: 데일리시큐-일시 2025년 4월 15일(화) / 오전 9시~오후 5시-장소: 한국과학기술회관 국제회의실 및 로비-인원: 정보보호 실무자 700여 명(현업 보안책임자/실무자만 참석 가능)-참가비: 현업 보안실무자는 무료-교육이수: 공무원 및 일반기업 보안교육 7시간/CPPG, CISSP 등 교육이수 7시간 인정-등록마감: 2025년 4월 13일 오후 5시까지-참석불가: 학생, 프리랜서, 무소속, 정보보호 업무와 상관없는 자는 참석불가-참관 및 참가기업 문의: 데일리시큐 길민권 기자 / mkgil@dailysecu.com-사전등록 필수: 클릭★정보보안 대표 미디어 데일리시큐 / Dailysecu, Korea's leading security media!★</div>

오픈소스 AI 모델의 사용이 급증하는 가운데, 공급망 보안을 위한 새로운 기술 대응이 시도되고 있다. 사이버 보안 기업 래브라도랩스(공동대표 김진석, 이희조)는 7일, 자사 SCA(Software Composition Analysis) 플랫폼에 AI 모델 탐지 기능을 추가하며 AI 공급망 보안 대응 강화에 나섰다고 밝혔다.

래브라도랩스, “오픈소스 AI 모델 보안 위협 선제 대응”…SCA 플랫폼에 AI 탐지 기능 추가

<div>AI 기술 주도권 확보 위해 국내 IT·통신·SI·리츠업계 AI DC 투자 확대네카오, 직영 데이터 구축·운영…통신사 등은 DC 임대 또는 서비스형 GPU 사업AI DC는 생존 필수 산업…최신 GPU·전력 인프라 외 차세대 냉각 시스템 개발도산업계에서 갑자기 튀어나온, 혹은 필연적으로 등장한 이슈의 전후사정을 살펴봅니다. 특정 산업 분야의 직‧간접적 이해관계자나 소액주주, 혹은 산업에 관심이 많은 일반 독자들을 위해 데일리안 ICT융합부 기자들이 대신 공부해 쉽게 풀어드립니다.<figure><img src="https://cdnimage.dailian.co.kr/news/202504/news_1743728228_1481432_m_1.jpeg" /></figure>#포지티브적 해석 : AI 주도권 확보와 탈(脫)통신을 위한 IT업계의 골든타임#네거티브적 해석 : 소유주·임대인은 좋지만 비싸질수록 임차인은 울겠네."하나의 인공지능(AI) 초거대언어모델(LLM)을 학습시키려면 최소 10기가와트(GW) 규모의 데이터센터가 필요하다. 1GW 규모의 데이터센터를 지으려면 400~500억 달러(58조∼72조원)가 소요된다."(최태원 SK그룹 회장)초거대언어모델, 데이터센터. 단어도 생소하고 10GW가 어느 정도인지 감이 잡히지도 않습니다. 초거대언어모델부터 살펴볼까요? 일반적인 언어모델은 수백만 개의 토큰(단어 또는 단어 조각)을 학습합니다. 반면, 초거대언어모델은 수십조 개에 달하는 토큰을 처리합니다. 대표적으로 메타(전 페이스북)의 '라마 2(LLaMA 2)', 구글의 '람다(LaMDA)' 같은 모델이 있지요.초거대언어모델을 공부시키려면 10GW의 전력이 필요하다고 합니다. 원자력발전소 1기의 전력 생산량을 약 1GW로 가정한다면, 초거대언어모델을 운영하는 데 원전 10기 규모의 전력이 필요한 셈입니다. 최 회장은 "50GW(5개) 정도의 데이터센터 필요하다"라고 언급했습니다. 투자 규모만 2900~3600조원이 되겠네요. 엄청난 액수입니다.초거대언어모델을 학습시키는 데이터센터. 우리가 AI 데이터센터라고 부르는 이 곳은 일반 클라우드 데이터센터와는 비교도 할 수 없을 정도로 방대한 규모를 자랑합니다. 네이버가 2023년 11월 세종특별자치시에 문을 연 '각 세종'은 축구장 41개 크기인 29만4000㎡ 부지에 설립됐습니다.60만 유닛(6차까지 전체 증설 시 최대규모)의 서버를 수용할 수 있습니다. 데이터센터에서는 서버를 선반처럼 쌓는 구조를 사용하는 데, 이 선반 단위를 랙(Rack)이라고 하고 랙 안의 높이 단위를 유닛이라고 부릅니다. 1 유닛짜리 서버로만 채운다면 60만대의 서버를 수용할 수 있다는 의미입니다.카카오는 지난해 6월 한양대학교 에리카 캠퍼스에 위치한 '카카오 데이터센터 안산'을 처음 공개했습니다. '카카오 데이터센터 안산'은 이 회사의 첫 자체 데이터센터로 4000개의 랙, 총 12만대의 서버를 보관할 수 있습니다. 양사 합산 투자 규모는 1조원이 넘습니다.<figure><img src="https://cdnimage.dailian.co.kr/news/202504/news_1743728228_1481432_m_2.jpeg" /></figure>조 단위를 투자하면서까지 네카오가 AI 데이터센터에 집중하는 이유는 무엇일까요. 짐작하다시피 AI 기술 주도권 확보를 위해서입니다. 생성형 AI 열풍 이후 AI 학습과 추론에 요구되는 방대한 연산 자원을 처리할 저장공간 수요가 커졌습니다. 이전에는 사용자가 포털에 키워드를 입력하면 검색한 웹페이지를 찾아 보여주는 것이 전부였으나 생성형 AI는 아예 답을 만들어 제공합니다.답을 주는 방식도 텍스트 뿐 아니라 영상, 그림, 음성 등 다양합니다. 최근 유행중인 '지브리풍' 그림 생성이 대표적입니다. "지브리 느낌으로 강아지가 초원에서 뛰노는 그림 그려줘."라고 사용자가 요구하면 언어 입력을 기반으로 이미지를 생성합니다. 이런 두 가지 이상의 모달, 즉 멀티모달 구조가 확장되고 있습니다.이를 잘 수행하려면 결국 방대한 저장공간이 필요합니다. AI 데이터센터는 그래픽처리장치(GPU), 고속 네트워크, 고밀도 랙·서버 슬롯, 전력 인프라 등이 필요합니다. AI는 텍스트, 이미지, 음성 등을 다 처리하므로 중앙처리장치(CPU) 보다 병렬 연산에 강한 GPU 서버를 사용합니다. GPU를 만드는 엔비디아에 IT 기업 수요가 몰리는 이유입니다.또 대용량 데이터를 빠르게 주고 받아야 하니 초고속 네트워크 장비도 투입됩니다. 서버를 많이 꽂을 수 있는 랙, 전기 안정성을 고려한 전력 인프라도 필수입니다. AI 데이터센터는 GPU, 고속 네트워크, AI 기술을 결합해 기업이 다양한 형태의 AI 서비스를 구현할 수 있도록 돕는 'AI 허브'와 같은 역할을 합니다.진화된 AI 시대를 대비하기 위해 기업들은 당연히 데이터센터에 대한 투자를, 그것도 무지막지하게 하겠지요. 구글, 아마존, 마이크로소프트, 오픈AI 등 빅테크들이 앞다퉈 시장 확대에 나서는 상황입니다. 투자 지역도 글로벌 단위로 다양합니다.<figure><img src="https://cdnimage.dailian.co.kr/news/202504/news_1743728228_1481432_m_3.jpeg" /></figure>AI 비즈니스 승부처는 이제 '어디에 얼마만큼의 AI 데이터센터를 갖췄는지'에 따라 달라질 것이라는 판단때문입니다. 경쟁사에 밀리다가는 비용과 속도는 물론 데이터 주권까지 잃을 수 있다는 절박감도 있습니다. AI 젠슨 황 엔비디아 CEO는 AI 데이터센터 확장 가치가 1조 달러(1452조원)에 달할 것이라고 전망합니다.직접 초거대언어를 개발하고 운영하는 네카오는 AI 데이터센터를 짓고 관리하는 것이 필수적입니다. 직영 데이터센터이지요. 직접 개발하지는 않지만 AI 데이터센터가 필요한 기업들에게 공간을 빌려주는 방식으로 시장에 뛰어든 국내 기업들도 있습니다.SK텔레콤, KT, LG 유플러스 등 통신사와 시스템통합(SI) 업체 등이 대표적입니다. 이들은 건물을 짓고 클라우드 서비스를 개발하는 곳(CSP)에 임대하거나 건물 전체를 임대(마스터리스)해 CSP에 재임대하는 방식으로 수익을 얻습니다.구체적으로 들여다볼까요. SK텔레콤은 소규모 모듈러 AI 데이터센터 서비스를 계획하고 있습니다. 화물 컨테이너 크기의 공간에 GPU 등을 비롯한 AI 인프라를 탑재하고 스타트업, 연구기관을 공략하는 방식입니다. 마치 임대인이 호텔을 짓고 임차인에 방을 빌려주는 그림을 그려볼 수 있겠네요.또한 가산 AI 데이터센터에 확보한 엔비디아 GPU H100를 AI 연산 인프라가 필요한 기업에 빌려주기도 합니다. 이 사업은 서비스형 GPU(GPU as a Service)라고 불립니다. 최근 GPU 클라우드 회사인 람다(Lambda)에 투자하기도 했지요. KT도 청주 AI 클라우드 데이터센터, 대덕 AI 클라우드 데이터센터에 엔비디아, AMD GPU를 수 천장 확보했습니다.<figure><img src="https://cdnimage.dailian.co.kr/news/202504/news_1743728228_1481432_m_4.png" /></figure>KT는 AI 데이터사업을 확장하기 위해 가산·경북 데이터센터를 대용량 GPU 수용이 가능한 AI DC로 개관할 예정입니다. 가산 데이터센터의 경우 10만개 이상 서버 수용이 가능한 규모로 키워 수도권 AI 데이터센터 허브로 만들겠다는 계획입니다. 이와 별도로 마이크로소프트와 손을 잡고 AI·클라우드 사업을 강화할 방침도 세웠습니다.LG유플러스는 2027년 준공을 목표로 경기 파주에 신규 AI 데이터센터를 짓고 있습니다. 파주 AI 데이터센터는 7만3712㎡ 부지에 구축되며 서버 10만대 이상을 수용하게 됩니다. LG유플러스는 전력 효율을 높이기 위해 액체 냉각 기술도 개발하기로 했습니다.진화된 AI 수요에 부응하려면 서버 및 전력 설비 외에 냉각 시스템이 필요합니다. 서버가 뜨거우니 냉방을 하는 것이지요. 기업들은 서버를 특수 액체에 담가 식히는 액침 냉각을 개발중입니다. 액침 냉각 기술은 에너지 및 공간 효율성이 높고, 소음이 거의 발생하지 않는다는 장점이 있습니다. LG유플러스는 이를 위해 글로벌스탠다드테크놀로지(GST)와 업무협약을 체결했습니다.급속도로 성장하는 AI 산업 속 AI 기술을 효과적으로 관리·운영하는 AI 데이터센터를 기업들은 새로운 먹거리를 넘어 생존에 필수적인 요소로 인식하고 있습니다. 똑똑한 모델을 빠르게 학습시키면서도 에너지 효율이 높은 AI 데이터센터를 선점하려는 비즈니스 산업 성장은 매해 가팔라질 전망입니다.AI처럼 속도전이 요구되는 상황에서 IT·통신·SI·리츠업계 기업들은 필요에 따라 '합종연횡'을 할 가능성도 예상됩니다. 곧 다가올 1500조원 규모 시장, 갈수록 치열해지는 AI 데이터센터 경쟁이 궁극적으로 한국 AI 산업을 고도화하고 디지털 주권을 탄탄하게 확보하는 교두보가 되기를 바라봅니다.</div>

AI 기술 주도권 확보 위해 국내 IT·통신·SI·리츠업계 AI DC 투자 확대. 네카오, 직영 데이터 구축·운영…통신사 등은 DC 임대 또는 서비스형 GPU 사업

[뭔일easy] AI 강자 치트키, 'AI 데이터센터'가 뭐길래

<div><img src="https://img.etnews.com/news/article/2025/04/07/news-p.v1.20250407.02f537b7d105421cb95546ee30fb53c4_P3.jpg" />필자는 그동안 문서 작성을 4단계로 구분해 왔다. '내용을 적은 워딩(Wording)' '정리·요약한 문서(Documentation)' '제출용 보고서(Report)' '설득용 제안서(Presentation)'가 그것이다. 그런데 최근 새로운 문서 작성 방법이 생겼다. 가칭 '인공지능(AI)이 만든 문서'다.직장, 학교 등에서는 이미 AI를 이용해 문서를 만들고 있다. 이용자가 생성형 AI 서비스에 문서 작성을 요구하면 즉시 글, 이미지, 도형을 포함한 문서를 생성한다. 사전지식과 자료 조사 없이 AI 기술이 즉시 그럴듯한 초안 문서를 제공하는 것이다. 이렇게 AI가 만든 문서를 사람이 손질해서 사용하는 것에 작성자, 저작권, 신뢰성 등 찬반 이슈가 있으나 관련 자료를 찾아 작성하는 기존 문서 작성 절차와 비교하면 생산성 혁명인 것은 틀림없다.지금은 생성형 AI가 강조되고 있는데, 서류를 접수·처리하는 행정업무에도 AI 기술을 적용할 수 있다. 특허청은 2024년 8월 'AI 기술을 활용한 특허행정 혁신 로드맵'을 발표하면서 'AI 기반 심사·심판 시스템 구축'이 핵심 목표임을 밝혔다. 향후 이 시스템이 가동되면 AI 가 항시 새로운 기술을 학습한 상태에서 수십 페이지의 특허명세서를 분석하므로 특허행정을 효율화할 수 있을 것이다. 이 AI 기술을 일반 행정에도 적용할 수 있지 않을까? 가상의 'AI 동료'가 문서를 검토해서 목적, 내용, 요구사항 등을 요약하고 선례와 비교·정리 해준다면 업무를 더 효율적으로 처리할 수 있어 시민 서비스 향상으로 연결될 것이다.이렇게 되려면 두 가지 선제 조건이 필요하다. 첫 번째는 제도적 기반이다. 2021년 3월 제정된 '행정기본법' 제20조에는 행정업무에 AI 기술을 적용해 완전히 자동화된 처분을 내릴 수 있는 근거가 규정되었다. 올해 1월 제정된 '인공지능기본법' 제16조에도 AI 기술 도입·활용지원 근거가 있어 정부의 AI 활용 의지는 긍정적이다. 두 번째는 제출문서가 디지털화 돼야 한다. 필자가 생각하는 디지털화의 의미는 데이터 이용 가능성이다. 전자문서는 구조, 표현, 콘텐츠로 구성돼 있다. 전자문서 내 콘텐츠는 주로 글, 그림, 표로 구성되는데 이 콘텐츠를 데이터로 활용할 수 있어야 비로소 '디지털 문서'가 된다.문서 관련 AI 분야는 IDP(Intelligent Document Processing)가 화두다. 이제는 'AI 친화적인 문서' 처리에 대해 고민해야 한다. AI가 처할 수 없는 문서는 'AI 동료'의 도움을 받을 수 없어 처리시간이 많이 소요되고, 자동화된 행정 처분도 할 수 없다. 예를 들면 개방형 워드프로세서 마크업 언어 포맷(예:HWPX)을 사용하고, 사진·이미지가 문서에 포함될 때 메타정보(EXIF)가 유지될 수 있도록 해야 한다. 문서 내 보호해야 할 기밀·개인 정보나 페이지가 있다면 AI 기술이 읽거나 학습하지 못하도록 금지 시키는 문법도 필요하다. 즉, AI 처리를 위한 새로운 기반과 표준이 필요하다. 앞으로는 AI 기술을 위한 '잘 읽히는 문서' 체계의 구축이 디지털 행정 더 나아가 스마트도시 행정 효율화를 위한 경쟁력이 될 것이다.최동준 스마트도시협회 부장 logisbrain@naver.com </div>

필자는 그동안 문서 작성을 4단계로 구분해 왔다. '내용을 적은 워딩(Wording)' '정리·요약한 문서(Documentation)' '제출용 보고서(Report)' '설득용 제안서(Presentation)'가 그것이다. 그런데 최근 새로운 문서 작성 방법이 생겼다. 가칭 '인공지능(AI)이 만든 문서'다.

[디지털문서 인사이트] AI 기술이 만드는 더 효율적인 문서처리 환경

<div><div style="position:relative;width:100%; height:0; padding-bottom: 56.25%;"><iframe src="https://www.youtube.com/embed/3avQ0-k0nEQ?si=8YVVPyf0u6qeBaij&amp;controls=0" allowfullscreen="" frameborder="0" style="width:100%; height:100%;top:0; left:0; position:absolute"></iframe></div><img src="https://www.hellot.net/data/photos/20250415/art_17439852372301_ea249a.jpg" />영상 인텔리전스 분야에서의 독보적 위치 각인시킨 사례로 남아트웰브랩스가 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 ‘아마존 베드록(Amazon Bedrock)’에 영상이해 AI 모델을 공식 공급한다. 글로벌 주요 AI 기업들과 어깨를 나란히 하며, 한국 기술의 저력을 전 세계에 각인시켰다. 트웰브랩스가 제공하는 모델은 멀티모달 AI 기반의 ‘마렝고(Marengo)’와 ‘페가수스(Pegasus)’로, 베드록에 탑재된 첫 번째 영상이해 특화 AI다. 아마존의 자체 모델인 Nova를 제외하면 유일한 영상 관련 모델로 선정되며, 영상 인텔리전스 분야에서의 독보적 위치를 다시 한 번 확인시켰다. 아마존 베드록은 고성능 AI 파운데이션 모델을 단일 API로 통합해 제공하는 AWS의 전략적 서비스다. 트웰브랩스를 비롯해 Meta, Anthropic, Mistral AI, DeepSeek, Stability AI 등이 참여하고 있다. 이 가운데 트웰브랩스는 한국 기업 최초로 모델을 탑재한 사례로 기록되며, 글로벌 AI 산업에서의 입지를 본격 확장하게 됐다.트웰브랩스의 모델은 영상 내 객체, 동작, 배경 소리 등 다양한 요소를 자연어로 검색하고 이해할 수 있는 기능을 갖췄다. 이를 통해 기존에는 접근하기 어려웠던 영상 데이터를 검색, 분류, 요약 및 분석하는 데 탁월한 성능을 발휘하며, 다양한 산업 분야에서 영상 기반 AI 활용도를 끌어올릴 수 있다.이번 협업을 통해 고객은 별도의 인프라나 AI 전문 지식 없이도 트웰브랩스의 모델을 활용해 고성능 영상 기반 생성형 AI 애플리케이션을 구축할 수 있다. 특히 데이터 통제권과 보안 요건을 유지하면서도 소규모 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 구현할 수 있다는 점에서 높은 평가를 받고 있다.AWS 미디어 및 엔터테인먼트 총괄 매니저 사미라 파나 바크티아르는 “트웰브랩스의 모델을 통해 고객들은 영상 데이터의 잠재력을 쉽게 끌어낼 수 있게 됐다”고 말했다. 실제로 영화 스튜디오, 방송국, 스포츠 리그, 광고 회사 등에서 영상 데이터를 검색, 하이라이트 추출, 맞춤형 콘텐츠 제작에 즉각적인 효과를 얻을 수 있을 것으로 기대된다.이재성 대표는 “글로벌 영상 데이터의 80% 이상이 충분히 활용되지 못하고 있다”며 “트웰브랩스는 사용자가 수년 전 영상부터 최근 촬영 영상까지 원하는 장면을 1초 안에 찾고 분석할 수 있도록 한다”고 설명했다.트웰브랩스는 이번 협업을 계기로 AWS와의 전략적 관계를 공고히 하고 있다. Amazon SageMaker HyperPod를 활용해 모델 학습 속도를 약 10% 향상시키고, 비용은 15% 이상 절감하는 성과를 거두며, AWS Activate와 AWS Marketplace를 통한 글로벌 비즈니스 확대도 본격화하고 있다. 트웰브랩스는 앞으로도 미디어, 스포츠, 스트리밍, 광고 등 영상 중심 산업을 중심으로 AI 기반 혁신 솔루션을 확장해 나간다는 계획이다. 헬로티 서재창 기자 |</div>

영상 인텔리전스 분야에서의 독보적 위치 각인시킨 사례로 남아. 트웰브랩스가 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 ‘아마존 베드록(Amazon Bedrock)’에 영상이해 AI 모델을 공식 공급한다. 글로벌 주요 AI 기업들과 어깨를 나란히 하며, 한국 기술의 저력을 전 세계에 각인시켰다.

트웰브랩스, AWS 베드록 탑재로 기술력 증명...세계 무대 입성

<div><img src="https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/202504/08/b93070ac-7216-4f77-b1ec-ce7f4f08e59e.jpg" />인공지능(AI)은 오랫동안 주식·채권에 투자하는 자산운용사와 헤지펀드 등 기관투자자들에게 유용한 도구였다. 세계 최대 자산운용사인 블랙록이 2018년 인공지능 연구소를 설립하고 AI 플랫폼 ‘알라딘’을 구축해 시장 데이터 분석과 포트폴리오 관리 같은 핵심 기능에 투입한 것이 대표적이다.주식·채권 시장처럼 막대한 데이터가 상시로 생산되는 환경에서 AI의 활용은 더욱 일반화될 것으로 예상된다. 특히 생성형 인공지능(GAI) 혁명 이후로 AI의 추론 능력이 비약적으로 향상되어 투자 전략 수립과 포트폴리오 관리의 고도화까지 가능해졌다. 조만간 기관투자자뿐 아니라 개인투자자를 대상으로 ‘AI 어드바이저’의 보편화가 현실이 될 것으로 보인다.<figure><img src="https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/202504/08/851b8317-299d-45fc-b45a-b567a14c31f6.jpg" /></figure>JP모건이 지난해 5월 선보인 ‘인덱스GPT’가 그 대표 사례다. 투자 테마를 입력하면 관련 키워드를 생성해주고, 뉴스 기사 등에서 해당 키워드가 언급된 기업을 선별해 준다. 예컨대 클라우드 컴퓨팅, e스포츠, 사이버 보안과 같은 테마에 부합하는 기업을 추출하고, 이를 바탕으로 포트폴리오를 구성할 수 있도록 자문한다.반면 비상장 기업에 직접 투자하거나 사모펀드에 출자해 간접 투자하는 기업 투자 시장에서는 그간 AI의 역할이 매우 제한적이었다. 그러나 GAI 혁명이 본격화되면서 투자 자문을 제공하는 증권사·회계법인·법무법인·컨설팅업체 등에서 적극적인 AI 도입으로 생산성을 높이려는 시도가 이어졌고, 가시적인 성과도 하나둘씩 나타나고 있다.무엇보다 투자 대상 기업과 산업에 대한 리서치 분야에서 GAI가 맹활약 중이다. 자문사들은 특화된 AI 솔루션을 적극적으로 도입하면서 자체 AI 플랫폼 구축에도 막대한 노력을 쏟고 있다. 이를 통해 리서치 결과의 신뢰성을 높이고 시간과 비용도 획기적으로 절감하고 있으며, 이러한 경험을 고객사인 기관투자자에게 전파하는 작업도 본격화되고 있다.글로벌 컨설팅업체인 베인앤드컴퍼니는 기관투자자들이 AI를 직접 도입하면 5년 이내에 업무 자원의 30~35%를 절감할 수 있다고 전망한다. 남는 시간과 인력을 투자 실행이나 전문성 강화에 활용할 수 있기 때문에 결과적으로 투자 성과 향상으로 이어질 가능성이 높다는 것이다.더 나아가 일부 기관투자자들은 아예 AI를 투자심의위원회 구성원으로 포함하는 실험도 시작했다. 현재는 AI에 실질적인 투표권을 부여하지 않고 있으나, 의사결정에 필요한 데이터가 축적되고 신뢰성이 쌓이면 투표권을 부여할 수도 있을 것이다. 물론 인간적인 직관이나 경험을 배제한 AI의 의사결정이 실제로 더 나은 투자 성과로 이어질지는 지켜봐야 할 일이다.이철민 VIG파트너스 대표</div>

인공지능(AI)은 오랫동안 주식·채권에 투자하는 자산운용사와 헤지펀드 등 기관투자자들에게 유용한 도구였다. 세계 최대 자산운용사인 블랙록이 2018년 인공지능 연구소를 설립하고 AI 플랫폼 ‘알라딘’을 구축해 시장 데이터 분석과 포트폴리오 관리 같은 핵심 기능에 투입한 것이 대표적이다.

기업 투자 시장에도 본격 도입되고 있는 AI

<div><img src="https://stock.mk.co.kr/photos/20250406/PCM20210916000063990_P4.jpg" />(서울=연합뉴스) 조현영 기자 = 1~5분 사이의 짧은 동영상인 이른바 '숏폼' 콘텐츠가 젊은 청년들의 스마트폰 과의존 문제를 심화할 수 있다는 연구 결과가 나왔다.과학기술정보통신부가 최근 발표한 '2024 스마트폰 과의존 실태조사' 결과에 따르면 20대는 스마트폰 과의존 위험군 비율이 34%로 성인 연령대 가운데 가장 높은데, 그 원인이 숏폼 때문일 수 있다는 것이다.6일 연세대학교 바른ICT연구소가 한국지식경영학회 '지식경영연구' 최근호에 게재한 논문에 따르면, 인스타그램 '릴스'와 유튜브 '쇼츠' 같은 숏폼 콘텐츠는 강한 중독성으로 인해 스마트폰 과의존 문제를 야기할 수 있다.스마트폰 과의존은 스마트폰을 지나치게 사용함으로써 스마트폰이 생활 패턴에서 차지하는 비중이 현저하게 증가하고 이를 조절할 능력이 감소해 우울, 수면 질 저하 등 문제가 발생할 정도에 이른 것을 말한다.이 같은 문제가 특히 20대에서 두드러지는 이유는 자율성과 독립성이 강조되는 시기적 특성상 스마트폰 사용에 대한 통제가 거의 없기 때문이라고 논문은 설명했다.실제로 숏폼 콘텐츠가 20대 스마트폰 과의존 문제에 영향을 끼치는지 알아보기 위해 바른 ICT 연구소 이건우 교수는 2019년부터 2023년까지 실시된 한국미디어패널조사 데이터를 활용했다.이 교수는 숏폼 콘텐츠가 온라인 동영상 서비스(OTT) 시청을 촉진하고, OTT 이용 빈도가 증가할수록 스마트폰 과의존 위험군에 속할 확률이 높아진다는 점에 착안해, 패널조사 데이터에서 1순위로 사용하는 사회관계망서비스(SNS)를 인스타그램이라고 답한 집단과 그렇지 않은 집단을 나눴다.그런 다음 숏폼 서비스 도입 시기인 2021년 전후로 두 집단의 주당 OTT 이용 빈도 변화 정도를 분석해 숏폼 시청과 과의존 사이 인과관계를 분석했다.그 결과 숏폼 도입은 20대의 주당 OTT 이용 빈도를 약 1 .7회만큼 유의미하게 증가시킨 것으로 나타났다.특히 인스타그램을 주로 사용하는 집단에서 이 같은 특징이 명확히 드러났다.이 교수는 일반적으로 OTT 이용 빈도가 높아질수록 스마트폰 과의존 위험은 증가하므로, 숏폼 콘텐츠 도입이 20대의 전반적인 스마트폰 과의존 위험군 증가에 직·간접적인 영향을 미쳤다고 볼 수 있다고 분석했다.그는 "숏폼 콘텐츠의 활성화가 스마트폰 과의존을 촉진한다면, 기업들은 더 많은 행동 데이터를 얻을 수 있게 되고, 이는 다시 스마트폰 사용 시간 증가를 부추겨 악순환이 형성될 수 있다"며 "과의존 문제를 단순히 개인의 자제력 부족이나 기술 중독으로만 볼 것이 아니라, 경제적·사회적 구조의 결과로 이해할 필요성이 있다"고 논문에서 밝혔다.그러면서 일정 시간 시청 시 휴식을 권장하는 알림 기능을 도입하는 등 플랫폼 운영자의 사회적 책임과 20대 스스로 사용 시간을 제한하는 등 자기 조절의 필요성을 강조했다.hyun0@yna.co.kr(끝) </div>

(서울=연합뉴스) 조현영 기자 = 1~5분 사이의 짧은 동영상인 이른바 '숏폼' 콘텐츠가 젊은 청년들의 스마트폰 과의존 문제를 심화할 수 있다는 연구 결과가 나왔다.

"숏폼 콘텐츠, 20대 스마트폰 과의존 문제 악화시켜"

<div><img src="https://img.etnews.com/news/article/2025/04/01/news-p.v1.20250401.952a163d2a274a43bf99e4b09a9ce12f_P1.jpg" />반도체 유리기판을 좌우활 소재는 단연 '유리'다. 실리콘 또는 플라스틱을 대체할 미래 기판 재료로, 가격과 물성 경쟁력을 두루 갖췄다. 특히 기존 기판 대비 표면이 매끈하고 휨 현상이 적어 인공지능(AI) 등 대면적 기판이 필요한 첨단 반도체에 적합하다.그러나 반도체 기판 산업에서 유례가 없던 소재다. 그만큼 반도체에, 그리고 기판 공정에 최적화된 유리가 필수다. 유리 업계에서 반도체 기판용 유리 연구개발(R&D)에 총력을 기울이는 이유다.세계적인 유리 전문 기업인 코닝은 이 시장에 일찌감치 뛰어들어 기술력을 축적 중이다. 쇼트·아사히글라스와 함께 세계 3대 유리 기업으로 꼽히는 코닝은 150년 이상 유리 시장에서 두각을 나타냈다. 특히 한국에는 1972년 진출, 오랜 기간 동안 국내 첨단 산업 내 유리 공급망의 한 축을 맡고 있다.코닝의 반도체 유리기판 차별화 전략은 '양산을 위한 협업'이다. 다루기 힘든 유리기판의 신뢰성을 높이려면 기판 시장 핵심 플레이어들과 협력이 전제돼야 한다는 판단에서다. 지금도 산·학·연과 함께 반도체 기판에 적합한 유리 재료 특성을 확보하고 있다.16일 서울 포스코타워 역삼 이벤트홀에서 열리는 '전자신문 테크데이 : 반도체 유리기판의 모든 것' 콘퍼런스에서는 코닝의 유리 역량을 파악하고, 반도체 기판 대량 생산을 위해 어떤 생태계를 조성해야하는지 통찰력을 공유한다. 이현성 한국코닝 이사가 첨단 패키징의 미래를 열 유리기판의 각종 과제 해결법을 제시한다. 유리기판은 미세 회로를 구현할 수 있다는 점에서도 각광받는다. 반도체 웨이퍼처럼 기판에도 전기 신호를 전달하는 회로가 있는데, 얇고 집적도가 높을 수록 고성능 기판을 만들 수 있다. 이를 위해서는 유리기판 회로를 형성할 여러 화학 물질이 필요하다. 와이씨켐의 감광액(포토레지스트)이 대표적이다. 빛과 반응해 성질이 변하는 감광액으로 유리기판의 미세 회로를 형성한다.와이씨켐은 반도체 제조를 위한 여러 감광액을 개발, 공급해왔던 회사다. 최근에는 유리기판용까지 개발, 상용화에 성공했다. 20년 이상 감광액을 개발·생산한 경험과 노하우가 주효했다. 와이씨켐은 유리기판용 박리액(스트리퍼)과 현상액(디벨로퍼)도 시장에 공급하며 유리기판 업계 핵심 화학 소재 업체로 급부상하고 있다.콘퍼런스에서는 김용일 와이씨켐 상무가 '글라스 패키지용 포토레지스트 개발'을 주제로, 반도체 유리기판용 핵심 소재 개발 현황과 시장 전략을 소개한다. 유리기판 제조 공정의 한 축인 소재를 심도 깊게 파헤칠 예정이다. 유리기판 신호를 전달하는데 꼭 필요한 공정 중 하나가 '메탈라이징'이다. 기판에 금속 박막을 형성하는 공정으로, 높은 순도와 밀도로 단단하게 기판과 붙어야 고성능 유리기판을 탄생시킬 수 있다. 기존 소재와 달리 유리 특성 때문에 기술 난도가 높은 공정으로 지목된다.주성엔지니어링은 이같은 메탈라이징 난제를 풀 신기술을 소개한다. 메탈라이징에는 금속을 증발시켜 표면에 적층하는 '증착' 기술이 주로 쓰이는데, 주성엔지니어링은 원자 수준의 초미세 증착(ALD)이 가능한 기술을 보유하고 있다. 반도체 뿐 아니라 디스플레이 분야에서도 기술력을 쌓아왔던 만큼 유리를 다루는 능력도 남다르다.주성엔지니어링은 최근 유리기판 훼손을 최소화할 수 있는 신기술을 확보했다. 보통 ALD는 1000도가 넘은 고온에서 이뤄지는데, 유리의 경우 깨지거나 회로가 녹을 가능성도 있다. 주성엔지니어링의 신기술은 업계 최초로 온도를 400도 수준까지 낮춰 안정적으로 유리기판을 제조할 수 있도록 했다.주성엔지니어링의 유진혁 개발본부장(부사장)이 이같은 유리기판 혁신기술을 집중 분석한다. 업계 최초 유리기판 핵심 증착 기술을 주제로, 시장 주도권을 쥘 방법론을 제시할 계획이다. 전례없는 증착 기술을 만나볼 기회다.콘퍼런스에 대한 자세한 내용과 참가 신청 방법은 전자신문 홈페이지(www.sek.co.kr/2025/techday)에서 확인할 수 있다. 권동준 기자 djkwon@etnews.com </div>

반도체 유리기판을 좌우활 소재는 단연 '유리'다. 실리콘 또는 플라스틱을 대체할 미래 기판 재료로, 가격과 물성 경쟁력을 두루 갖췄다. 특히 기존 기판 대비 표면이 매끈하고 휨 현상이 적어 인공지능(AI) 등 대면적 기판이 필요한 첨단 반도체에 적합하다.

[미리보는 '유리기판' 테크데이]<끝> 미래 책임질 소재·신기술…'코닝·와이씨켐·주성'

오픈AI, 구글 등 주요 기업의 인공지능(AI) 모델이 책 20만여권을 불법 복제한 데이터를 학습했다는 연구 결과가 나왔다. 7일 미국 민간 연구단체 전미경제연구소(NBER)는 최근 '불법 복제 데이터 접근이 거대언어모델(LLM) 성능에 미치는 영향' 논문에서 “LLM은 상당한 경제적 가치를 입증했지만, 저작물을 불법 복제한 콘텐츠에 의존해 법적·경제적·기술적 문제를 야기했다”며 이같이 설명했다.

"챗GPT-제미나이는 불법 복제물...오픈AI·구글 AI 모델, 책 20만권 불법 복제 데이터 학습”

관련 뉴스