
Connecting the dots! 우주의 모든 존재는 서로 연결됐다. 인류 기술발전의 역사는 연결점들을 모두 찾아내고 그 연결방식을 개발해온 과정이다. 흩어졌던 점들이 마법처럼 연결되는 그 순간, 우리는 깊은 깨달음을 얻는다. 우리는 세상 모든 점이 함께 숨 쉬듯 연결된 세상을 꿈꾼다.
인공지능(AI) 대중화 혁명 중심에는 거대언어모델(LLM)이 있다. LLM 성취와 비견될 큰 사건엔 무엇이 있을까?
AI가 그랬듯 인터넷도 처음엔 난해하고 낯설었다. 웹 이전 시대엔 아키, 고퍼, 광역정보서버(WAIS) 등 항법 창치가 필수였다. 아키로 파일전송프로토콜(FTP) 서버 파일을 찾고, 고퍼의 메뉴체계를 더듬어 인터넷을 누볐다. 초기 인터넷 항법은 엄격하고 딱딱했다. 메뉴와 디렉토리는 질서정연했고, 서로 호환되지 않았다. 우리는 항법장치별 구조와 특성을 습득하고 복종해야 했다. 인터넷은 거대한 정보 창고였지만, 아무나 드나들 만한 곳은 아니었다.
1990년대 초 팀 버너스 리는 HTML과 URL, HTTP라는 새로운 정보공유 시스템을 제안했다. 웹의 탄생이다. HTML은 인터넷 세상 모든 '정보자원'을 '하이퍼링크'로 연결했다. '원 클릭'만으로 '한 걸음'에 연결! 하이퍼링크는 종종 깨졌고, 페이지는 사라졌지만, 느슨한 초연결성 웹은 폭발적으로 성장했다. 완벽한 분류나 일관성은 포기했다. 완벽하게 통제하려 하지 않았다. 누구나 새 링크를 만들고 어떤 자원이든 연결할 수 있었다. 간결한 HTML의 이 '느슨한 연결'은 인터넷에 확장성과 자율성을 제공했고, 웹은 더욱 빠르게 성장했다.
검색엔진과 웹봇의 출현은 '웹 서핑'을 넘어 '웹 발견'을 촉발했다. 검색어 입력을 통한 웹 발견은 느슨했던 웹의 활용법을 혁신했다. DB 게이트웨이, 자바, HTML5 기술은 웹을 '정적인 읽기 공간'을 넘어 '동적 실행 공간'으로 승격했다. 하지만 HTML로 연결 가능한 점과 선의 종류는 몇 안 됐다. HTML이 연결한 것은 정보자원일 뿐. “브라우저로 OS를 대체하자!”는 비전, 넷스케이프와 썬이 꿈꿨던 OS 의존성을 탈피한 '네트워크 컴퓨터 세상'은 오지 않았다. 클라우드와 서비스형 소프트웨어(SaaS) 발전에도 불구하고 정교한 정보 연계과 실행은 여전히 사람의 명령과 조작을 요구한다.
AI 대중화 혁명은 바로 LLM이 이끄는 '제2차 느슨한 연결 혁명'이다. HTML이 '구체적 정보자원'을 느슨하게 연결했다면, LLM은 '추상화된 정보자원'을 느슨한 언어 인터페이스로 연결하고 조작하고 실행한다. 이제 더 이상 버튼을 누르고 파일을 열지 않는다. “요약해줘” “코드를 짜줘” “어떤 선택이 가능해?”라 말할 뿐. LLM이 단어와 개념을 엄격하게 정의하고 연산하지는 못하지만, 벡터공간 유사성과 문맥적 근접으로 의미소들을 조합하고 그럴싸한 실행을 대행한다. 느슨한 연결이라는 한계 때문에 단번에 성공하기는 어렵지만 조금씩 고쳐가면 꽤 쓸만해진다.
트랜스포머와 셀프어텐션은 입력값들을, 검색증강생성(RAG)은 바깥세상 데이터들을, LLM 내부의 느슨한 지식체계에 느슨하게 연결한다. 응용 프로그래밍 인터페이스(API)나 에이전트 호출도 '외부실행'과 '내부생성'을 느슨하게 엮는다. 인간 언어가 본디 불완전하고 느슨한 연결성만 지원하는 한계 때문이다.
하지만 HTML 시절보다 연결 가능한 점들이 훨씬 더 다양해졌고, 연결과 조작방식도 하이퍼텍스트보다 훨씬 다양해졌다. 정확성과 일관성은 더 느슨해졌지만 풍부한 대량 데이터 학습과 거대 모델, 고속의 생성 반복 연산을 거치면 그럴싸한 창작성마저 출현한다.
'느슨한 연결'은 약한 연결이지만 유연한 연결이다. 엄격한 연결은 강하고 견고하지만, 선형계 혹은 형식시스템 바깥의 많은 문제 앞에서는 한계를 드러낸다. 모순투성이인 우리 삶과 존재를 온전히 담아내기 어렵다. 웹의 창시자 팀 버너스 리가 꿈꾸었던 정보자원들 사이의 질서정연한 연산과 추론의 '시맨틱 지식 웹'은 아직 이루어지지 못했다. 구체적 정보자원들을 느슨하게 연결한 HTML이 진화한 LLM은 추상화된 '상징'을 시행착오적 '실행'을 통해 유연하게 연결한다. 브라우저가 OS가 되고 웹이 곧 지능이 되는 세상은 안 왔지만, 사람의 '언어'와 '몸짓'이 LLM을 통해 가상공간의 다양한 정보자원들과 연계되고 실행되며 현실 세계를 향해 펼쳐지기 시작했다.
김주한 서울대 의대 정보의학 교수·정신과전문의 juhan@snu.ac.kr