AI로 숲속 새소리 구별한다…구글, 뉴럴 네트워크 개발

입력 2022-01-28 10:53
AI로 숲속 새소리 구별한다…구글, 뉴럴 네트워크 개발

"새는 숲의 건강성 지표…대형 산불 뒤 딱따구리 많아졌다는 것 파악"

(샌프란시스코=연합뉴스) 정성호 특파원 = 세계 최대 검색엔진 업체 구글이 인공지능(AI)을 이용해 숲에서 지저귀는 새소리로 그 새가 어떤 종(種)인지 파악하는 기술을 개발하고 있다.

구글은 27일(현지시간) 온라인 프레스 행사를 열고 현재 개발 중인 '머신러닝(ML)을 이용한 새소리 구분 및 분류' 기술을 소개했다.

구글에 따르면 새는 중요한 생태 지표다. 생태학자들은 새를 통해 숲의 건강성을 파악할 수 있다. 일례로 어떤 숲에 딱따구리가 많다면 그 숲에는 죽은 나무가 많다는 뜻이다.

또 새소리는 울창하게 우거진 숲에서 어떤 새가 있는지를 알아내는 더 효율적인 방법이다. 전문가들은 눈으로 파악하는 것보다 최대 10배 많은 새를 귀로 식별할 수 있다.

여기에 최근 자율녹음장치(ARU)가 도입되면서 숲에서 발생하는 수천 시간분의 온갖 소리를 녹음할 수 있게 됐다. 그러나 사람이 이를 일일이 듣고 여기서 특정한 새소리를 걸러내는 것은 방대한 노동을 요구하는 작업이다.

구글의 생체음향학팀은 머신러닝 기술에 눈을 돌렸고, 그 결과 '새소리 구분 및 분류' 기술을 만들어냈다. 여전히 오차와 착오가 있지만 이를 활용하면 숲이나 동물 서식지의 생태계를 파악하고 멸종위기종을 찾아내 이를 보호하는 데 도움이 될 것으로 연구진은 기대하고 있다.

숲에서 새소리가 가장 왕성한 시기는 새벽이다. 많은 새가 가장 활동적인 때여서 '새벽 합창'이라고 부를 만큼 풍부한 새소리가 들린다.

문제는 여러 새가 동시에 지저귀기 때문에 이를 일일이 구분하기 어렵고, 특정한 새소리를 인공지능이 학습하도록 할 때 표본으로 삼을 깨끗한 새소리 녹음 데이터가 없다는 것이다.

코넬대학이나 학술재단 등이 축적한 새소리 음성 데이터가 있지만 모두 자연 상태에서 녹음된 것이어서 바람 소리나 벌레 소리 등의 '잡음'이 들어가 있다.



구글 연구팀의 스콧 위즈덤은 "숲속은 각종 음성 활동이 고밀도로 이뤄지는 곳이어서 여러 사람이 한꺼번에 떠들어서 알아듣기 힘든 '칵테일 파티 문제'가 생긴다"며 "소리 분리 기술을 통해 이 문제를 해결했다"고 말했다.

이 과정에서 구글 연구팀은 독자적인 '분리 뉴럴 네트워크'를 개발했다. 전통적으로 소리 분리를 할 때는 잡음 없는 깨끗한 녹음 데이터를 표본으로 쓰는데 새소리는 이런 음성 데이터가 없기 때문이다.

그래서 여러 소리가 뒤섞인 2개의 '오디오 믹스처'를 합친 뒤 분리 뉴럴 네트워크로 이를 다시 분리한 다음 원본과 일치하는 정도를 평가해 소리 분리법을 자율적으로 훈련하도록 했다.

위즈덤은 "이렇게 소리를 분리한 뒤 기존 새소리 데이터를 이용한 '분류 뉴럴 네트워크'를 돌려 이게 어떤 새소리인지를 판별한다"고 설명했다.

연구진의 한 명인 톰 덴튼은 "이 머신러닝 모델을 캘리포니아 과학아카데미에 제공한 결과 대형 산불 뒤 딱따구리가 더 많아졌다는 것을 파악했다"면서 "희귀종이나 멸종위기종의 존재를 파악해 이를 보호하는 데도 쓰일 수 있을 것"이라고 말했다.

그러면서 앞으로 이 모델을 수중 생체음향을 파악해 수중 생태계를 이해하거나 소리로 지각 활동을 탐지해 지진을 예측하는 데에도 활용할 수 있을 것으로 내다봤다.

sisyphe@yna.co.kr

(끝)

<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>