구글 신은 내 사생활과 위선까지 안다
신간 '모두 거짓말을 한다'
(서울=연합뉴스) 이웅 기자 = 흔히 사람들이 슬픔을 달래기 위해 농담을 할 거로 생각하지만, 실상은 그렇지 않다. 사람들은 일이 잘 풀리고 즐거울 때 더 자주 농담을 한다.
사람들은 대도시에 사는 소득 수준이 높은 고학력자들의 불안감이 클 것으로 예상하지만, 실제론 시골에 사는 소득 수준이 중간인 저학력자들이 더 많은 불안감을 드러낸다.
신간 '모두 거짓말을 한다'(더퀘스트 펴냄)에는 이처럼 우리의 통념에서 벗어나는 반직관적 데이터가 수두룩하다.
타인에게는 말하지 않을 것 같은 내밀한 사생활, 욕망, 증오와 편견, 두려움과 고통, 위선 같은 불편한 진실들이 포함돼 있다.
주로 구글 검색정보를 수집해 구축한 빅데이터를 분석한 결과다.
저자는 하버드대 경제학과 박사과정에 있는 신예 데이터 과학자인 세스 스티븐슨 다비도위츠. 그는 구글 검색정보 수집 프로그램인 '구글 트렌드'를 이용한 미국 선거 판세 분석으로 학계 주목을 받았다.
버락 오바마가 당선된 2008년 미국 대선 때 유수 여론조사기관들은 오바마가 흑인이라는 사실이 선거에 거의 영향을 미치지 않았다는 분석 결과를 내놨다. 이는 미국이 인종적 편견에서 벗어난 탈인종 사회가 됐다는 선언으로 받아들여졌다.
하지만 구글은 설문조사와는 전혀 다른 미국의 모습을 보여줬다.
오바마가 당선된 날 밤 백인 국수주의자 사이트 스톰프런트의 검색과 가입은 평소의 10배로 급증했고, 일부 주에선 '최초의 흑인 대통령'보다 '깜둥이 대통령'을 더 많이 검색한 것으로 조사됐다. 오바마가 노골적인 인종주의로 잃은 표는 전체의 4%에 달하는 것으로 추정됐다.
다비도위츠는 이런 내용을 담은 연구논문을 학술지 다섯 곳에 제출했으나 게재를 거부당했고, 동료들조차 그렇게 많은 미국인이 악랄한 인종차별적 생각을 지녔다는 사실을 믿으려 하지 않았다.
그러다 구글 검색정보를 토대로 작성한 미국의 인종주의 지도가 2016년 대선에서 당선된 도널드 트럼프 지지율을 표시한 지도와 일치한다는 사실이 알려지면서 다비도위츠는 본격적으로 재평가받기 시작했다.
그의 분석 결과에 따르면 트럼프에 승리를 안겨준 지지층은 오바마 연구에서 드러난 은밀한 인종주의자였다.
책은 정하웅 한국과학기술원(KAIST) 물리학과 교수 등이 펴낸 '구글 신은 모든 것을 알고 있다'(2014년 사이언스북스 펴냄)를 떠올리게 하지만, 그보다 훨씬 어두운 사람들의 내면을 탐색한다.
그렇다면 사람들은 왜 여론조사 요원에게는 하지 않는 말을, 구글 검색창에는 하면서 진짜 선호를 드러내는 걸까.
이 책에 감명받아 서문을 쓴 스티븐 핑커 하버드대 심리학과 교수는 사람들이 "키보드로 얻은 익명성 덕분에 매우 이상한 것들을 고백"하기 때문이라고 설명한다.
설문조사를 할 때 멀쩡하게 보이기 위한 사람들의 작위적 반응을 전문가들은 '사회적 바람직성 편향(social desirability bias)'라 부른다. 다비도위츠는 빅데이터가 하는 반대 작용을 '디지털 자백약'이라고 명명한다.
빅데이터를 분석해 보면 사람들이 일관되게 섹스 횟수를 부풀린다는 사실을 알 수 있다. 구글에 드러난 결혼생활의 가장 큰 불만은 '섹스 없는 결혼생활'로 '사랑 없는 결혼생활'보다 8배나 많이 검색된다. 그리고 대화하지 않는 배우자에 대한 불만보다 성관계를 원하지 않는 배우자에 대한 불만이 16배나 많았다.
결혼하지 않은 커플도 마찬가지다. 문자메시지에 답을 하지 않는 애인보다 성관계를 원하지 않는 애인에 대한 불만이 5.5배 많았으며, 그런 불만은 남자보다 여자 쪽이 두 배나 많았다.
빅데이터를 수집·분석하는 기술은 종전처럼 뇌 영상을 촬영하고 인간의 몸에 전극을 심는 것과는 완전히 다른 방식으로 인간의 마음을 연구할 길을 터준다.
이 같은 데이터를 제공하는 '디지털 금광'은 구글만이 아니다. 위키피디아, 페이스북, 스톰프런트는 물론 방대한 포르노사이트인 폰허브에서도 풍부한 데이터 원석을 채굴할 수 있다고 한다.
다비도위츠는 "사람들의 정보 검색 그 자체가 정보"라고 말한다. 그리고 빅데이터가 각 학문 분야에 가져올 혁명적 변화를 낙관한다.
"데이터 분석의 미래는 밝다. 차세대 킨제이는 분명 데이터 과학자일 것이다. 차세대 푸코는 데이터 과학자일 것이다. 차세대 마르크스는 데이터 과학자일 것이다. 차세대 소크는 데이터 과학자일 것이다."
이영래 옮김. 360쪽. 1만8천원.
abullapia@yna.co.kr
(끝)
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
뉴스