
약물화 가능한 화합물 간 조합 가짓수는 10의 60제곱개에 달한다. 전통적 신약 개발은 평균 10~15년이 걸리고 20조원의 비용이 든다. 전 세계적으로 매년 250조원 이상이 신약개발에 투입되지만, 임상 최종 성공률은 10% 미만이고 초기 후보물질이 시판으로 이어질 확률은 0.1%도 되지 않는다. 후보물질 탐색과 효능 검증이 단절적으로 이뤄지는 구조적 비효율이 핵심 병목이다. 하지만 인공지능(AI)을 만나며 판이 달라지고 있다. 고성능 그래픽처리장치(GPU)와 대규모 학습데이터의 결합으로 생명현상과 약물 반응을 디지털로 재현하는 시대까지 현실로 다가오고 있다.
"생물학은 정보처리"…AI가 통하는 이유
AI 같은 컴퓨팅 기술이 바이오 산업에 활용되기 시작한 건 수십 년 전부터다. 생명현상은 근본적으로 '정보처리시스템'이기 때문이다. 구조활동정량분석(QSAR), 컴퓨터활용약물디자인(CADD) 같은 기법은 20세기 중후반부터 활용돼 왔다. 다만 이들 접근은 ‘계산’은 가능했어도, 방대하고 복잡한 생명현상을 충분히 재현하거나 과감한 탐색을 밀어붙이기에는 역부족이었다.이상엽 KAIST 생명화학공학과 특훈교수는 약물 혼용을 예시로 바이오 연구의 난이도를 설명했다. 이 교수는 “약이 약 2300 종류가 있다고 알려져 있는데, 두 가지만 섞어도 조합이 230만 가지쯤 된다”며 “하지만 전 세계적으로 알려진 약물 간 부작용은 20만 가지 정도에 불과하고, 나머지 210만 가지는 안전한 게 아니라 ‘모르는’ 상태”라고 말했다.
구글 딥마인드의 ‘알파폴드’는 이런 불확실성에 새로운 길을 열었다. 기존에는 약물 개발마다 다른 알고리즘을 개발해야 했으나, 알파폴드는 단백질 접힘 방식을 예측하고 과학자들이 약물 표적에 대한 이해를 높이는 데 도움을 주고 있다.

AI를 활용한 신약개발은 개념을 넘어 임상 단계까지 진입했다. 글로벌 AI 신약개발 선두 기업 인실리코 메디슨은 자체 AI 플랫폼 ‘Pharma.AI’를 활용해 개발한 후보 약물을 최초로 미국 임상 2상에 진입시킨 회사다. 여기에 투입된 금액은 15만 달러고, 46일 만에 폐질환 후보물질을 발굴했다. 업계 관계자는 “AI를 활용하면 개발 기간을 1~2년으로 단축하고, 비용을 1조원 미만으로 줄일 수 있다”고 말했다.
자본시장에서도 ‘바이오AI’는 핵심 테마다. 오픈AI가 투자한 차이 디스커버리는 지난해 12월 시리즈B 투자라운드에서 1억3000만달러를 유치하며 기업가치 13억달러를 인정받았다. 설립한 지 2년도 안된 스타트업이 유니콘 기업이 된 것이다. 이 회사의 모델 ‘차이-2’는 기존 성공률 0.1% 미만이던 드 노보 항체 설계 영역에서 16% 성공률을 달성하며 100배 이상 개선된 성능을 입증했다. 미국의 자이라 테라퓨틱스도 설립 6개월 만에 10억달러 투자를 받았고, 인실리코 메디슨은 지난해 12월 홍콩증권거래소에 상장했다.
AI는 생명현상을 가상 환경에서 재현하는 영역에서도 활용되고 있다. 구글 딥마인드는 현재 가상세포 연구를 진행 중이다. ‘가상세포’는 실제 세포의 기능과 반응을 AI로 모사한 모델로, 약물 반응을 예측하거나 질병 메커니즘을 분석하는 ‘디지털 트윈’ 접근으로 설명된다.
유전자 대규모언어모델(LLM) 개발 시도도 이뤄지고 있다. 구글 딥마인드와 예일대 연구진은 ‘C2B' 프로젝트를 통해 세포 유전자 데이터를 문장 단위로 해석하고, 특정 조건에서 약물이 면역 반응을 어떻게 바꾸는지 예측하는 모델을 개발 중이다.
연구진은 지난해 10월 이 모델이 세포 유형 예측에서 95.43% 정확도를 기록했다고 보고했다. 이어 암이 육안으로 관찰하기 어렵다는 점에 착안해, ‘종양 신호를 드러나게 하는 약물’을 찾도록 모델에 지시한 뒤 4000여 종 약물을 시뮬레이션해 후보 물질을 도출했다고 밝혔다. 연구진에 따르면 이 후보 물질의 ‘종양 신호 증폭’ 기능이 기존 학계에 보고된 적 없었다.
"실험실이 스스로 진화한다"
AI 실험자동화 기술의 지향점은 ‘셀프 드라이빙 랩(SDL)’이다. SDL은 AI가 가설을 세우고 후보물질을 추린 뒤, 로봇 등 자동화 장비가 실험을 수행해 데이터를 만들고, AI가 다시 결과를 학습해 다음 실험을 제안하는 구조다. 단순 자동화를 넘어 연구실이 스스로 설계·해석·개선하는 ‘자율 진화형 연구 플랫폼’인 셈이다.
국내에서도 SDL 연구가 활발하다. 이 교수 연구팀은 최근 UC샌디에이고와 공동으로 AI 기반 유전자 기능 규명 전략을 발표했다. 미생물 유전체의 3분의 1은 아직 기능이 밝혀지지 않은 가운데, 연구팀은 효소 기능을 나타내는 EC 번호를 AI로 예측하는 방법을 고도화했다. GPU 딥러닝으로 9513개 유전체에서 나온 약 3394만 개 단백질 서열의 기능을 230시간 만에 예측한 사례도 제시했다. 이 교수는 “향후에는 결과의 근거를 설명할 수 있는 ‘설명 가능한 AI’가 병행돼야 한다”고 강조했다.
남재욱 서울대 화학생물공학부 교수는 '루프화'와 '표준화'를 강조했다. 그는 “SDL이 자리 잡으려면 연구에서 끝나는 게 아니라 산업화까지 이어져야 한다”며 “연구 이후 단계까지 자율화하고, 그 결과를 다시 AI가 학습해 다음 연구로 연결하는 구조가 관건”이라고 강조했다. 표준화와 관련해서는 “장비나 운영시스템(OS) 측면에서 통일된 표준 기술조차 없어 규격화에 애로가 크다”고 했다.
정부도 관련 지원에 나서고 있다. 보건복지부는 혁신 신약·의료기기 등 초격차 기술 확보에 3798억 원을 배정했다. KAIST는 대전 ‘K-바이오 파운드리’에 AI 실험 인프라를 조성 중이며, 단백질 구조 예측을 넘어 분자 내 물리·화학적 상호작용까지 학습하는 차세대 모델 ‘K-Fold’ 개발도 추진하고 있다.
최영총 기자 youngchoi@hankyung.com
