구글·네이버 검색 빅데이터 분석
4월 들어 안철수 급증…중순 이후 문재인 다시 역전
'양강구도' 속 토론마다 홍준표 '관심 흥행'
[ 박희진 기자 ] 지난해 11월 미국 대통령 선거를 앞두고 여론조사와는 반대로 도널드 트럼프의 승리를 점친 소수의 사람들이 있었다. 이들이 예측 근거로 제시한 것은 구글 검색량이었다. 당시 트럼프는 구글 검색 빈도를 지수화한 '구글 트렌드'에서 힐러리 클린턴을 앞서고 있었다.
일주일 뒤 열리는 대통령 선거를 앞두고 국내에서도 검색 빅데이터를 기반으로 판세를 점치려는 시도가 이어지고 있다. 주요 포털과 소셜네트워크서비스(SNS)에서 나오는 검색 빅데이터가 대한민국 19대 대통령도 맞힐 수 있을지 주목된다.
30일 현재 포털 검색 빈도에서 1위를 달리고 있는 주자는 문재인 더불어민주당 후보다. 지난 2주(14~28일) 동안 구글 트렌드 분석 결과, 문 후보가 평균 77로 안철수 국민의당 후보(68)를 앞섰다.
구글 트렌드는 일정 기간 검색 횟수가 가장 많은 시점을 100으로 정하고 나머지 시점의 검색 빈도를 상대적 수치로 환산해 나타낸다. 같은 기간 홍준표 자유한국당 후보는 41, 유승민 바른정당 후보는 23, 심상정 정의당 후보는 22로 집계됐다.
지난 3월 내내 문 후보의 검색 빈도가 안 후보보다 많았지만 이달 들어서는 판세가 뒤바뀌었다. 안 후보가 빠르게 치고나가면서 이달 중순에는 두 후보 간 검색 빈도의 격차가 꽤 벌어진 상태였다.
지지율 추격자 입장이던 안 후보가 대선 후보 등록 전후 높은 관심을 받았던 것으로 풀이된다. 여기에 부인 김미경 서울대 의과대학 교수의 특혜 채용 논란과 보좌진에게 사적인 업무를 지시한 사실, 예비군훈련 불참 의혹 등이 제기되면서 검색이 증가한 것으로 보인다. 그러다 지난 17일을 기점으로는 문 후보쪽으로 다시 관심이 기우는 모습이다.
TV 토론이 열린 날에는 홍 후보의 검색량이 급증해 눈길을 끈다. 특히 3차 TV 토론이 있었던 지난 23일에는 홍 후보의 구글 트렌드 지수가 82까지 치솟아 안 후보를 제치고 문 후보와 공동 1위를 기록했다. 이날 TV토론이 시작된 저녁 8시부터 10시까지 네이버 실시간 검색어 상위권(1~10위)에는 '홍준표'를 포함한 키워드가 가장 많았다.
검색 지수와 순위 등 검색 빅데이터는 유권자들의 관심도와 대선 관련 주요 이슈를 읽는 데 유용하다. 그러나 검색 지표가 지지율과 직결되는 것은 아니다. 후보자에 대한 부정적인 의혹 등이 제기될 경우 검색 빈도가 증가할 수 있기 때문이다. 실제로 각 후보 이름과 함께 검색된 단어에는 부정적인 이슈와 관련된 것들도 적지 않았다.
구글 트렌드에 따르면 이달 들어 홍 후보 관련 검색어 중 검색 빈도가 가장 많이 증가한 것은 '홍준표 돼지' '홍준표 자서전' 등으로 나타났다. 안 후보의 경우는 '안철수 조폭' '안철수 유치원' '안철수 예비군' 등이 있었다.
네이버의 빅데이터 포털인 데이터랩에 따르면 23일 TV토론이 진행 중이던 저녁 8시25분~30분 홍 후보와 관련된 검색어는 10위 내에 7개 이상 등장했다. 돼지흥분제, 성폭력, 강간미수, 성범죄 사퇴와 같은 부정적 단어들이 대부분이었다. 네이버 데이터랩에서는 30초 단위로 급상승 검색어 추이를 확인할 수 있다.
당시 토론에서 후보들은 '돼지발정제' 논란을 언급하며 홍 후보에게 사퇴를 요구했다. 홍 후보는 자서전에 대학 시절 돼지발정제를 사용한 성범죄 모의에 가담했다는 내용을 써 논란이 됐다.
유권자들의 관심도는 소셜네트워크서비스(SNS)에서도 비슷하게 나타났다. 트위터와 소셜미디어 분석업체 다음소프트는 지난 17~23일 트위터에 올라온 단어를 분석한 결과 돼지흥분제가 가장 많았다고 밝혔다.
박희진 한경닷컴 기자 hotimpact@hankyung.com
뉴스