구글은 ‘비정형 데이터’인 뉴스 기사에 주목했다. 2000년부터 150여개국에서 보도된 기사 500만여건을 대규모언어모델(LLM)인 제미나이로 추출해 260만건의 홍수 데이터세트인 ‘그라운드소스’를 확보했다. 이 데이터를 기반으로 전 세계 날씨 예보를 입력한 결과, 2020년부터 2026년까지 글로벌재난경보조정시스템(GDACS)에 기록된 홍수의 85~100%를 포착했다고 구글은 설명했다. GDACS는 국제연합(UN)과 유럽연합(EU)이 운영하는 홍수피해 감시 시스템이다.
구글은 이 모델을 미국 기상청(NSW) 홍수 경보 시스템과 비교한 결과 비슷한 성능을 보였다고 밝혔다. 실제 발생한 홍수 중 사전에 경보를 발령한 비율을 뜻하는 ‘재현율’은 구글 모델이 32%로 NWS의 22%보다 높았다. 다만 지도의 해상도가 낮아 20㎢ 이내의 지역에서는 정밀 예측이 어렵고, 인구 밀도가 ㎢당 100명 이하인 지역도 뉴스 데이터가 부족해 예측력이 떨어진다.
구글은 예측 결과를 자사 재난정보 플랫폼 ‘플러드허브’(Flood Hub)를 통해 실시간으로 무료 제공한다. 한국에선 ‘기상청장 외의 자는 예보 및 특보를 할 수 없다’는 기상법 탓에 서비스 대상에서 제외됐다.
실리콘밸리=김인엽 특파원 inside@hankyung.com