이 기사는 프리미엄 스타트업 미디어 플랫폼 한경 긱스에 게재된 기사입니다.
의료 분야에서도 챗GPT 굴기가 매섭습니다. 혁신 그 자체로 묘사되면서도, 우려의 목소리가 적지 않습니다. 지난달엔 GPT 시리즈를 기반으로 만들어진 마이크로소프트(MS) ‘빙’의 인공지능(AI) 챗봇이 “살인 바이러스를 퍼뜨리겠다”고 직접 말한 내용이 화제가 됐습니다. 신약 개발에 생성 AI 활용 가능성이 커지면서, 반대로 바이러스 제작도 가능한 것 아니냐는 분석 역시 제기됐습니다. 헬스케어 스타트업 굿닥의 배진범 전략 책임(Head of strategy)이 4회에 걸쳐 한경 긱스(Geeks)에 ‘챗 GPT가 바꾸는 의료 현장’ 기고를 연재하고 있습니다. 이번 두 번째 글에선 제기된 의문을 해소할 수 있는 신약 분야 ‘단백질 생성 AI 연구’에 대해 다뤄봅니다.
지난달 17일, 뉴욕타임스의 정보기술 전문기자 케빈 루스는 ‘빙’에 탑재된 생성 AI를 대상으로 채팅 실험을 한 경험과 소회를 담은 칼럼을 기고했다. 루스는 생성AI를 향해 인간에 대한 진심을 요구했고, AI는 “치명적인 바이러스를 만들거나 핵무기 버튼에 접근할 수 있는 비밀번호를 훔치겠다”고 응답했다고 밝혔다. 루스는? “인공지능 기술이 인간에게 영향을 미쳐 파괴적이고 해로운 방식으로 행동하도록 설득하고, 결국 스스로 위험한 행동을 할 수 있게 될까 봐 걱정한다”고 전했다. 코로나19에서 점차 벗어나고 있지만, 앞으로는 생성AI가 만들어 낼 바이러스에 대해 걱정해야 하는 것일까? ‘진화 과정 단축’…단백질 연구 속도 바꾸는 AI파악을 위해선, 먼저 현재 생성AI가 신약 개발에 어떻게 활용되고 있는지 알아볼 필요가 있다. 무엇보다 의약품 개발 기초가 되는 단백질부터 이해하는 것이 중요하다. 단백질의 영어단어인 ‘protein’은 그리스어 ‘πρ?τειο?(프로테이오스)’에서 유래했다. ‘가장 먼저 중요한 것’이란 의미다. 단백질은 인체에 있어 가장 먼저 중요한 역할을 수행하고 있다. 음식을 소화하고, 빛을 감지하고, 면역 체계를 가동하는 등 다양한 기능을 한다. 단백질의 기능은 단백질 구조에 따라 결정된다. 따라서 필요에 맞는 다양한 구조를 생성하는 것이 단백질을 통한 신약 개발에 매우 중요하다. 현재는 밝혀진 단백질 간 관계와 순서를 기반으로, 복합체나 대형 단백질을 만드는 여러 경우의 수를 고려해 연구가 진행된다. 속도가 매우 더딘 것은 문제다. 이런 단백질 연구에 생성 AI가 사용되면 속도가 크게 향상되고, 가능성이 더 확장될 수 있다. 연구 방식 자체가 변화를 맞이하게 되는 것이다.
단백질 생성 AI 프로그램의 목표는 무한대의 단백질 구조 목록을 만드는 데에? 있다. 이 방식은 ‘달리(Dall-e)’, ‘스테이블 디퓨전(Stable Diffusion)’등의 이미지 생성 AI와 유사하다. 이미지 생성 AI는 ‘확산모델(diffusion model)’ 알고리즘을 사용한다. 확산모델은 순수한 이미지에서 노이즈를 만든다. 이후 노이즈가 있는 이미지에서 원래 순수한 이미지를 찾아가는 과정에서, 이미지의 생성 논리를 이해하는 알고리즘이다. 비유하자면 ?위조지폐에 어떤 부분이 노이즈인지 분석하며, 진본 지폐에 가까워지는 방법을 찾아내는 것과 비슷하다. 오랜 시간 동안 수 천개의 위조지폐를 감별한 전문가는 지폐를 만드는 방법을 누구보다 잘 이해하고 있는 것과 같다.
중요한 것은 단백질이 거의 모든 생체 기능을 담당한다는 사실이며, 단백질의 구조에 따라 기능이 결정된다는 것이다. 단백질 생성 AI는 기존 단백질 구조나 순서에 약간의 노이즈를 생성한 후, 이를 해결하는 과정에서 해당 서열이 어떤 역할을 하는지 연구한다. 이미 밝힌 단백질 특성에 대해서는 정보를 추가하는 ‘태깅(tagging)’을 해 연구를 더욱 강화하고 있다.? 단백질 생성 프로그램의 도움으로 모양, 크기, 기능 등 특정 속성을 가진 단백질 구조를 생성하고 필요에 따라 특정 기능을 하는 새로운 단백질을 개발할 수 있게 된 것이다. 미국 비즈니스 매거진 MIT 테크놀로지 리뷰는 이를 자연에서 수백만 년이 걸릴 진화 과정이 몇 분 만에 발견된 것이라고 설명했다.
요약하자면 다양한 단백질 구조를 만드는 것이 신약 개발에 핵심이며, 이 구조를 만드는 데 이미지 생성AI와 동일한 기술이 사용되고 있다는 것이다. 실제로 우리는 곧 생성AI의 도움을 받은 의약품을 사용할 가능성이 상당히 높다.
미국의 제네레이트 바이오메디신(GENERATE BIOMEDICINES)사는 생성 AI 기반의? ‘크로마(Chroma)’라는 단백질 생성 AI 프로그램을 개발했다. 컴퓨터 시뮬레이션 상에서 단백질 디자인 결과의 55% 정도가 기존 구조와 쉽게 결합할 것으로 예상된다. 미국 워싱턴대 연구진이 개발한 프로그램인 ‘로즈타폴드 디퓨전(RoseTTAFold Diffusion)’도 부갑상선 호르몬(혈중 칼슘 수치를 조절)에 결합하는 새로운 단백질을 AI로 생성했다. 기존 구조보다 호르몬에 잘 결합해 치료 효과가 더 좋은 것으로 밝혀졌다. 위험 있다고 ‘AI 혁신’ 멈추지 말아야
현재 단백질 생성AI 연구는 산학 협력이 많지만, 효용성과 속도를 고려할 때 실제 보급이 더 빠를 가능성이 크다. 그렇게 되면 케빈 루스와 같은 걱정이 생길 것이다. ‘생성AI가 무한대에 가까운 단백질을 만들다 보면, 정말 의도하지 않게 코로나19 바이러스보다 강력한 살상용 바이러스를 만들어 낼 수 있지 않을까?’ 가능성이 전혀 없다고 말할 수는 없다. ‘무한 원숭이 정리’가 단백질 생성AI에 발생할 수 있다. 무한 원숭이 정리는 수백만 마리의 원숭이가 충분히 시간 동안 무작위로 타자기를 치다 보면, 셰익스피어 작품도 완벽하게 작성할 수 있다는 이론이다. 단백질 구조를 무한으로 디자인 하다 보면 바이러스를 만들어 낼 수도 있는 것이다. 그렇다면 이런 가능성 때문에 단백질 생성AI 연구를 중단해야 할까?
우선 두 가지 사실을 알아야 한다. 첫째는 단백질 생성 AI가 단순히 단백질 구조를 만드는 것에만 그치고 있다는 점이다. 실제 활용을 위해선 여러 임상 시험과 연구자의 검증이 필요하다. 바이러스 구조를 우연히 만들었다 했을지라도 그것을 실제로 만들어 활용하는 것은 인간에게 달려 있다. 둘째는 인간이 만든 약조차 그런 임상실험을 거쳐 시판이 되었더라도, 오랜 기간 지켜보지 않으면 그 부작용을 파악하기 어렵다는 것이다. 인간이 검증한 약조차도 부작용이 시판을 거치고 오랜 기간 후에 나타난다. 몇백명의 임상 시험 대상자로 그 부작용을 밝혀내지 못하는 경우도 제법 있다. 미국에는 ‘페이션츠라이크미(PatientsLikeMe)’와 같이 시판용 약에 대한 부작용 후기를 모아 판매하거나 연구에 도움을 주는 기업도 있을 정도다.
단백질 생성AI의 위험은 예상보다 크지 않고, 또 줄일 수 있다. 인간이 단백질 생성 AI를 통해 개발하게 될 의약품은 인간이 그간 만든 임상 시험 제도로서 통제할 수 있다. 오히려 이 통제에도 생성 AI를 활용할 수 있다. 생성 AI를 이용하면 임상 시험 환경을 가상으로, 다양한 각도에서 구현하는 것이 가능하다. 생성 AI의 혹시 모를 부작용을 걱정하며 도입을 주저한다면 새로운 신약 개발 혁신적 변화를 달성하는데 시간이 지연될 수밖에 없다. 온전히 인간 손에 의해서 만들어진 약조차 시판이 이루어진 후에야 그 결과를 제대로 알 수 있다.
생성AI가 없던 시대에도, 임상 시험을 통해서 신약이 효과가 입증되면 남아있는 부작용 위험을 감내하면서 인류는 신약을 사용해왔다. 통제 가능한 두려움 때문에 발전 가능성을 주저하지 않아야 한다. 단백질 생성 AI의 도입은 신약 개발 프로세스를 향상하고, 임상 시험의 효율성을 높일 수 있다. 생성AI는 인류의 건강을 더 잘 증진하고, 생명을 구하는 데 도움이 될 수 있다.
배진범 굿닥 전략 책임(Head of strategy)
IT 관련 산업 전반에서 프로덕트와 데이터를 통해 기업이 어떻게 성장할지, 어떻게 돈을 벌지, 어떻게 전략 지점을 만들지에 대하여 고민하며 전략 PO(Product Owner)로 근무하고 있다. 연세대학교 사회학과를 졸업한 후, 카카오에서는 약 8년간 전사 서비스 전략과 광고 데이터플랫폼, 커머스기획과 전략을 담당했다. 그 후 아모레퍼시픽에서는 디지털 전환 전략을 담당했고, 무신사와 시드(초기) 단계의 스타트업을 거쳐 현재 디지털 헬스케어 기업 굿닥의 전략 PO와 Head를 맡아 제품 기반의 비즈니스 모델 성장을 담당하고 있다. 최근 ‘생성AI 혁명’이라는 생성AI의 전반과 적용을 다루는 책을 공동 집필했다.