프로테오믹스(Proteomics, 단백질체학) 기반 정밀의료 기술개발 기업 베르티스는 딥러닝 기반 AI 기술을 적용, 단백체 질량분석 데이터만으로 질병 여부를 판별할 수 있는 진단 모델 연구를 ‘2022 세계단백체학회(HUPO, Human Proteome Organization)’에서 발표했다고 9일 밝혔다.
세계단백체학회는 단백체 분야 세계 최대 규모의 학술행사로, 지난 4일부터 8일까지 멕시코 칸쿤에서 열렸다.
베르티스는 머신러닝을 기반으로 기존의 질량분석 프로테오믹스 데이터 해석의 한계를 극복을 위해 `SAN(Spectrum is All You Need)` 프로젝트를 추진 중이다. SAN은 혈액 검체의 질량분석 스펙트럼만으로 질병 여부를 판별할 수 있는 모델 개발 프로젝트다.
베르티스는 이번 세계단백체학회에서 난소암·췌장암 진단 모델의 정확도를 평가한 첫 번째 연구 결과를 선보였다.
베르티스가 개발한 딥러닝 모델은 단백체 스펙트럼으로 난소암과 췌장암의 질병 유무를 판별했다. 정확도는 95% 이상이었다.
이번 연구에서 베르티스 연구팀은 질량분석을 통해 난소암 군 혈액 검체 156개(건강한 사람 50%, 난소암 환자 50%), 췌장암 군 혈액 검체 116개(건강한 사람 50%, 난소암 환자 50%)의 단백체 스펙트럼을 확보했다. 질환별로 각각 80%와 10%의 검체에 대한 스펙트럼을 딥러닝 모델을 학습시키고 학습 내용을 검증시키는데 활용했으며, 나머지 10%를 가지고 질환 유무를 판별하는 테스트를 진행했다.
연구 성과 발표는 16년간 구글에서 소프트웨어 엔지니어로 활약하고 올해 7월 베르티스의 미국법인 베르티스 바이오사이언스에 합류한 에릭 김 수석 머신러닝 엔지니어(Principal Machine Learning Engineer)가 주도했다.
에릭 김 수석 엔지니어는 “딥러닝을 적용해 질병 진단의 정확도와 검사로서 효율성을 혁신적으로 높일 수 있는 가능성을 제시했다는 점에서 프로테오믹스 기반 진단 기술의 전환점을 마련했다”며 “기술의 완성도를 높이고 실제 임상에서 주요 질환의 조기 진단을 활성화에 기여할 수 있도록 향후 연구에도 최선을 다하겠다“고 말했다.
김상태 베르티스 바이오사이언스 최고기술책임자(CTO)는 “인체의 단백체는 질병 발현의 실제 신호지만, 정보 중 절반 이상이 해석조차 불가능해 버려지고 있는데 이런 상황에서 SAN은 AI 기술 기반으로 완전히 새로운 데이터 해석 방식을 구현하며 단백체 데이터의 해석과 활용을 극대화할 수 있는 길을 열었다”며 “이번 연구 성과를 더욱 활성화하고 질병 조기 진단, 동반 진단과 치료 타겟 발굴 등에 응용하여 정밀의료를 실현할 것”이라고 말했다.
베르티스는 암 등 주요 질환을 보다 정확하고 신속하게 판별하는 진단 솔루션을 위한 연구개발을 가속화할 계획이다.