
바이라인네트워크에서 스타트업을 리뷰합니다. 줄여서 ‘바스리’. 투자시장이 얼어붙어도 뛰어난 기술력과 반짝이는 아이디어, 새로운 비즈니스 모델을 가진 스타트업은 계속해 탄생하고 있습니다. 세상을 깜짝 놀라게 하겠다고 출사표를 던진 이들을 바이라인의 기자들이 만나봤습니다.
글로벌 제약사가 마음 먹고 뛰어들어도 10년이 걸린다는 신약 개발 시장에 인공지능(AI)이 도전한다. AI의 역할은 예상 외로 핵심적이다. 바이러스의 감염을 막는 항체의 디자인을 설계하는 아주 중요한 일을 맡았다.
바이러스는 우리 몸속에 들어와 단백질(세포)과 붙으면서 감염을 시킨다. 이때 항체가 바이러스에 먼저 들러 붙어 감염을 막는데 AI가 이 항체를 설계한다. 이 작업은 결코 쉽지 않다. 어떤 바이러스가 어떤 모양을 하고 들어올지 예측하기 어렵기 때문이다. 가능성에 가능성을 더해야 하는 수 싸움이다.
지난 2020년 9월 출범한 갤럭스는 서울대학교 석차옥 교수와 그의 연구진이 만든 스타트업이다. 신약 개발 AI를를 만든다. 갤럭스 대표인 석차옥 서울대 교수는 약 20년간 연구소를 운영하면서 단백질 설계 연구에 몰두해왔다. 오랜 연구와 기술 개발 덕분에 갤럭스는 국제 단백질 구조 예측 대회 CASP, 국제 단백질 상호작용 예측대회 CAPRI 등의 글로벌 대회에서 우승을 거머쥐며 존재감을 드러내고 있다. 갤럭스는 각종 암과 비만 치료를 위한 단백질 설계에 성공하기도 했다.
신약 개발에 AI가 왜 필요한지, 그리고 왜 단백질을 설계해야 하는지, 이를 위해 갤럭스가 보유한 기술력은 무엇인지 지난 3일 박태용 갤럭스 부사장(=사진)을 만나 설명을 들어봤다.
-AI 신약 개발이 조금 생소하다
단백질이라는 생체 분자를 디자인하는 AI 기술을 개발하고 있다. 단백질은 우리 몸 속의 디옥시리보핵산(DNA), 리보핵산(RNA)을 통해 만들어지는 만큼, 몸 속 모든 생물학적 과정과 깊게 연관이 되어 있다. 단백질에 변성이 생기면 암에 걸리는 등 몸에 이상이 생긴다. 이런 질병을 치료하려면 (단백질을) 원래대로 돌려줘야 하는데, 두 가지 방법이 있다. 잘못된 것을 되돌려주는 것과 해당 세포를 죽이는 것. 이때 단백질의 원래 기능을 되돌려 놓기 위해 다양한 종류의 약을 쓸 수 있다.
예를 들어, 코로나19 바이러스에 감염이 됐다고 가정하자. 코로나19 바이러스가 우리 몸 속 단백질에 붙으면서 감염이 이뤄진다. 감염을 막기 위해선 바이러스가 단백질에 붙지 못하게 해야 한다. 그 중 한 가지 방법으로 바이러스에 단백질 항체를 붙여 몸 속 단백질과 붙지 못하게 해야 한다. 갤럭스는 단백질 항체를 만드는, 구체적으로 단백질로 된 신약을 만들 수 있도록 하는 솔루션 ‘갤럭스 디자인’을 개발했다.
-어떤 원리로 신약 개발 솔루션을 만든 것인가
암으로 예를 들어보자면, PD-1과 PD-L1이라는 단백질이 있다. 전자는 면역세포에 있고 후자는 일반적인 세포에 있다.
암이 걸린다는 것은 DNA에 돌연변이가 생기는 것이다. 사실 (이런 돌연변이 세포가 매일 생기지만) 면역 세포가 잘 죽이기 때문에 문제가 없는 것이다.
반면, 암이 확장될 때는 다르다. 면역 세포가 돌연변이 세포를 죽이려고 할 때, 돌연변이 세포가 PD-L1 세포와 결합하면서 “나 아군이야”라며 막는다. 그러면서 돌연변이 세포가 계속 번식을 한다. 그러나 항체가 PD-L1 세포와 먼저 결합해 돌연변이 세포가 결합, 번식하지 못하도록 막는다. 이것이 암 세포를 죽이는 원리다. 갤럭스는 이 항체를 디자인하는 AI를 개발한다.
항체 외에도 어떤 단백질이든 다 디자인할 수 있다. 그 중 항체가 가장 시장성이 있고 중요한 모델이어서 집중을 하고 있다.
-항체가 가장 어려운 이유가 있나
쉽게 말해 항체는 6개의 손가락을 가지고 있다. 이를 상보성 결정 부위(complementary determining region, CDR)라고 하는데, 이것이 다양한 아미노산으로 바뀔 수 있고 다양한 모양을 가질 수 있다. 그러니까 어떤 병원체가 들어오더라도 딱 맞는 모양을 만들 수 있다.
문제는 손가락 6개가 유연하다는 점이다. 타깃하는 병원체가 정확히 어떻게 생겼을지 몰라 항체의 손가락 6개를 AI가 예측하는 것이 어렵다.
-적중률은 얼마나 되나
중요한 것은 지금까지는 신약개발하는 AI를 아예 만들 수 없었지만 이제 만들 수 있을 정도로 기술이 올라왔다는 점이다. 지금까지 발표된 사례로, 작년 11월 미국의 한 스타트업에서 코로나19 바이러스에 붙는 항체를 만들었다. 성공 확률은 0.0017%다. 1만개 디자인하면 1개 성공 사례가 나오는 것. 그렇다면 100만개를 테스트하면 100개의 성공 사례가 나올 확률이 있다는 이야기다.
-정확도는 얼마나 되나
그건 계산하기 어렵다. 다만, 지금까지 6개 사례 중 거의 실패 없이 원하는 항체를 확보했다. 단백질을 디자인할 때 어려운 타깃과 쉬운 타깃으로 나눠져 있다. 어려운 타깃은 성공률이 더 낮고 쉬운 타깃은 성공률이 높다. 얼마나 도전적인 목표를 잡느냐에 따라 정확도가 다르다.
어려운 타깃은 병원체 구조가 밝혀지지 않은 탓도 있다. 이렇게 되면 예측한 병원체 모델에다 항체를 디자인해야 한다. 이중고로, 이중 에러가 쌓이는 셈이다.
-신약 개발 타깃 질병은 무엇인가
다양한 종류의 암과 비만 치료에 해당된다. 비만의 경우 살이 빠질 때 근육도 함께 빠지는 문제가 있어 근육을 유지해주는 신약을 개발했다.
-갤럭스 디자인, 국내 식품의약품안전처나 미국 식품의약국(FDA)의 승인을 받았나
그렇지 않다. 갤럭스는 항체를 위한 단백질을 디자인하는 곳으로 허가가 필요 없다.
-글로벌 제약사의 경우 신약 개발 솔루션을 개발하기 위해 상당한 규모의 투자를 하는데, 갤럭스의 강점은 무엇인가
결국 사람이다. 현재 AI 개발자가 11명, 연구개발(R&D) 등 합치면 총 35명의 인력이 있다. 석차옥 대표는 20년 동안 연구실 운영하면서 단백질 설계 연구에 있어 꾸준히 글로벌에서 이름을 알려왔다.
-어떤 데이터를 주로 학습했으며 AI 모델링은 어떻게 했나
단백질 구조 데이터 등은 퍼블릭 데이터를 활용했다. 차별화 지점은 AI를 학습시키는 선생님이 좋다는 것. AI 모델링의 경우 오픈소스와 자체 아이디어를 활용했다. 갤럭스 대표와 AI팀의 인사이트를 담았다. 예를 들어, 아미노산이 20개가 있는데 이것이 각각 어떻게 상호작용하는지 AI가 배우도록 했다. AI가 이 원리를 잘 배울 수 있도록 모델링을 하는 것에는 상당한 노하우와 철학이 들어간다.
일반적으로 거대언어모델(LLM)을 학습 시킬 때 문제와 답을 넣는데, 갤럭스는 문제와 답을 넣고 “이게 왜 답이라고 생각하냐”고 묻는 등 문제의 원리를 찾고 만들도록 했다. 데이터 양이 적어도 원리를 학습했다면 (해당 모델의) 적용 가능성은 무궁무진하다.
-글로벌에서 갤럭스에 대해 어떤 반응인지
글로벌 투자사, 해외 제약사 등에서 연락이 와 논의 중이다.
-그들이 관심을 갖는 포인트는 무엇인지
AI 기술이 없었을 때는 전통적 방법으로 항체 등을 만들었다. 그러나 AI로 이를 대체하면 기존에 더 어려웠던 항체를 만드는 등의 효율적으로 할 수 있는 일이 많아진다.
-수익모델은 어떻게 되나
제약사와 함께 신약 개발을 하게 되면 계약금을 받는다. 이후 약 개발을 시작해 임상이 진행될 때마다 성공 보수를 받고, 약이 시판됐을 때 총 판매 액수의 일정 비율을 받는 것이 수익모델이다.
-갤럭스의 궁극적인 목표는 무엇인지
어떤 질병이라도 치료할 수 있는 신약을 만들어내는 것. 현실적으로, 신약 개발을 효율적으로 하고 기존에 접근하기 어려웠던 문제를 풀게 됨으로써 많은 사람들이 약의 수혜를 받을 수 있도록 하는 것이다. 또 AI와 제약이 국가 경제에 중요한 산업이 되어 도움이 되는 것이다.
글. 바이라인네트워크
<홍하나 기자>0626hhn@byline.network