"데이터 너무 커 AI 적용 어려운 화학…'문법' 가르쳐야"

입력 2024-05-24 15:44
"데이터 너무 커 AI 적용 어려운 화학…'문법' 가르쳐야"

백무현 IBS 분자활성 촉매반응 연구단 부연구단장



(서울=연합뉴스) 조승한 기자 = "화학에도 인공지능(AI)이 도입되고 있지만 학습할 데이터가 너무 큰 문제가 있습니다. 문장 AI가 문법을 파악하듯 AI에 화학의 '문법'을 알려주는 방향을 고려해야 합니다."

백무현 기초과학연구원(IBS) 분자활성 촉매반응 연구단 부연구단장은 24일 서울 중구 서울역 회의실에서 열린 한국과학기자협회-IBS 과학미디어아카데미에서 이같이 말했다.

백 부단장은 이론화학을 활용해 컴퓨터 계산 등으로 화학반응을 예측하는 분야인 계산화학 전문가다.

계산화학은 물질 에너지를 계산하는 밀도범함수이론(DFT) 시뮬레이션 등으로 분자의 구조와 반응 등을 예측함으로써, 엄청난 시간과 자원이 투입되는 물질 합성 시행착오를 줄이고, 물질이 합성되는 원리를 밝혀내는 데도 유용하다.

백 부단장은 장석복 단장 연구팀과 함께 항생제나 화학제품 원료로 쓰이는 화합물인 '락탐'을 계산화학을 통해 상온 합성하는 방법을 제시해 국제학술지 '사이언스'에 소개한 사례를 소개했다.

그는 "질소 1개와 탄소로 이뤄진 고리 화합물인 락탐이 합성 중간에 분해되는 문제는 화학계 대표적 난제"라며 "이를 계산화학을 통해 한 번에 해결하는 방법을 찾았다"고 말했다.

최근 계산화학도 다른 학문과 마찬가지로 AI가 최대 화두지만, 문제는 데이터라고 그는 설명했다.

화학은 학습에 필요한 데이터가 너무 크고, 그나마 양질의 데이터도 부족해 적용이 힘들다는 것이다.

예를 들어 유기 화학은 화합물의 화학 반응이나 성질을 결정하는 분자 내 특정 부분인 '작용기'를 바꿔 성질을 바꿀 수 있는데, 대표적인 작용기만 40개고 화합물 내에서 바꿀 수 있는 위치도 분자가 커질수록 많아져 AI가 학습해야 할 경우의 수가 기하급수적으로 늘어난다.

대표적 화학 항암제 탁솔의 경우 분자 특성을 조정하기 작용기를 달 수 있는 곳만 15곳이라 해도 40을 15번 곱한 어마어마한 숫자가 나오는데, 이는 챗GPT가 학습한 데이터의 수조 배 수준이라고 그는 설명했다.

그는 "문장에서 문법이 있고 단어가 있듯 화학에도 전자의 움직임 패턴 같은 문법이 있다"며 "데이터가 크지 않아도 이런 문법으로 이해하게 만들면 적은 데이터베이스에서도 좋은 결과를 얻을 수 있다"고 말했다.

그는 2020년 사이언스에 발표했던 전기적 에너지만으로도 작용기 특성을 바꿔 화학 반응을 제어하는 '전기적 유도 효과'의 사례를 들며 작용기를 설명할 수 있는 문법을 먼저 찾으면 데이터를 획기적으로 줄일 수 있다고 소개했다.

백 부단장은 "AI가 이미 적은 데이터베이스에서 특정 문제를 찾을 때는 깜짝 놀랄 결과를 내고 있다"며 데이터를 줄일 문법을 찾는 데 주력하겠다고 밝혔다.

shjo@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>