의료 AI가 '정확하다'는 것과 '치료 효과가 개선된다'는 것은 다르다

입력 2020-01-15 15:13
수정 2020-01-15 15:15
“의사를 능가하는 인공지능(AI)이 개발됐다.” 최근 언론 기사에서 심심치 않게 볼 수 있는 제목이다. 정말 의사보다 실력이 좋은 인공지능이 개발된 것이라면 왜 당장 모든 병원이 인공지능으로 진료하지 않을까.

A라는 병원의 엑스레이 사진에서 병변을 찾는 인공지능을 개발한다고 해보자. 1만 장의 엑스레이 사진이 있다면 80%의 데이터는 인공지능을 학습시키기 위해서, 나머지는 그렇게 만들어진 인공지능의 정확성을 검증하기 위해서 사용한다.

이렇게 정확성을 평가하는 것을 내부 검증이라고 부른다. 80 대 20으로 학습용, 검증용 데이터를 구분했지만 기본적으로는 동일한 병원에서 나온 데이터를 이용하는 것이기 때문이다. ‘인공지능이 의사를 능가했다’는 언론 보도들은 대부분 내부 검증에 기반한 것이다. 이런 인공지능은 이제 무수히 많다.

하지만 내부 검증만으로 인공지능의 정확성을 평가하는 데는 한계가 있다. 현실을 충분히 반영한다고 보기 어렵기 때문이다. 더 엄정한 검증을 위해서는 다른 환경에서 얻어진 데이터, 예를 들어 B병원에서 얻은 데이터를 대상으로 외부 검증을 하거나 무작위 대조군 임상시험 등을 해야 한다. 하지만 이런 엄정한 검증을 거친 인공지능은 세계적으로도 아직 많지 않다.

또 인공지능이 ‘정확하다’는 것과 ‘치료 효과가 개선된다’는 것은 다르다. 정확성이 높다고 해서 기존 대비 환자의 치료 결과가 반드시 더 좋아지는 것은 아니기 때문이다. 판독이 확진이 아닐 수 있고, 진단하더라도 약이 없을 수도 있다. 혹은 인공지능의 도움 없이도 환자를 치료하는 데 큰 문제가 없었을 수도 있다.

이 개념을 구분하는 것은 이제 산업적으로도 중요하다. 바로 의료 인공지능이 국민건강보험의 적용을 받을 수 있을지를 판단하는 기준이기 때문이다. 최근 보건복지부가 발표한 영상의학 분야 인공지능 가이드라인에 따르면 단순히 ‘정확하다’는 것만 입증한 인공지능은 예외적인 경우를 제외하면 건보의 적용 대상이 되지 않는다. 더 나아가 인공지능으로 ‘치료 효과가 개선된다’는 경우에만 비로소 건보 적용 대상으로 고려된다.

이번 가이드라인은 세계적으로도 드물게 의료 인공지능에 대한 보험 적용 기준을 명확하게 제시했다는 점에서 의미가 있다. 하지만 산업계의 기대에 비해서는 보수적이라는 점을 부인하기 어렵다. 가이드라인에 따르면 기존에 식품의약품안전처의 인허가를 받은 인공지능 기술 대부분은 현재 상태로는 수가를 받기 어렵다. 기업들은 이제 추가적인 임상 연구를 통해 치료 효과의 개선을 증명해 수가를 받거나 보험 적용 이외의 사업 모델을 강구해야 할 것이다. 향후 보험의 적용을 받는 경우라고 할지라도 어느 수준의 수가가 책정될지도 관건이다.

눈부신 발전을 거듭하고 있는 의료 인공지능은 이제 진료 현장 도입을 논의하기에 이르렀다. 규제 및 수가와 관련된 가이드라인이 제정된다는 것은 그만큼 기술이 현장에 가까워졌다는 뜻이다. 이번 수가 가이드라인은 산업계 입장에서 아쉬울 수도 있겠으나 굳이 따지자면 규제의 불확실성이 줄어들었다는 점에서 긍정적인 측면도 없지 않다. 인공지능 기술의 개발에 대한 합리적인 평가와 보상을 통해 기술의 개발 주체와 적용 대상 모두가 윈윈할 수 있기를 기대해본다.

최윤섭 < 디지털헬스케어파트너스 대표 >