뉴스래빗 데이터저널리즘 'DJ 래빗' 2회
'강남역 살인' 한 달..추모 쪽지 2618건 키워드
총 3만1829개 단어, 13만1705자 형태소 분석
최다 등장 : "삼가 고인의 명복을 빕니다"
여성 혐오 : '0.63%' 논란 비해 적었다
5대 키워드 그리고 연결망 : 미안, 꿈, 꽃, #, 사회
2618건 강남역 추모 메모 모두 공유합니다
[편집자 주] 5월의 강남역은 뜨거웠습니다. 국내 최다 유동인구를 자랑하는 대한민국 한복판인 이 곳의 한 상가 화장실에 지난달 17일 새벽 스물세살 여대생은 일면식도 없던 남자가 휘두른 흉기에 숨졌습니다. 성난 여성과 불안한 시민들은 강남역 10번 출구로 모여들었습니다. 접착식 메모(포스트잇)에 추모글을 적어 붙이기 시작했습니다. 5000여장(추정치)이 넘는 메모가 강남역 10번 출구를 뒤덮었습니다. 부산 대구 대전 등 전국 추모 물결이 일렁였습니다
유례를 찾기 힘든 사회 현상이었습니다. 쪽지엔 저마다의 분노와 원망, 그리고 반성과 미안함이 빼곡했습니다. 여성 혐오 논란과 약자 상대 폭력, 남녀 공용화장실 안전, 정신질환자 관리 등 방치됐던 사회 문제를 수면 위로 끌어 첨횟윱求?
사건 발생 한 달을 맞습니다. 뉴스래빗의 데이터저널리즘, 'DJ 래빗' 2탄은 '강남역 추모 메모' 키워드 분석입니다. 자발적 시민의 의견이 옥외 현장에 다량, 실시간 기록된 최초 사례로 데이터 저널리즘적 가치가 큽니다. 주요 키워드 추출로 이번 강남역 살인 사건을 바라보는 시민 관점의 경향성을 추론할 수 있습니다.
뉴스래빗이 수집한 2618건 메모에 가장 많이 등장한 키워드는 무엇이고, 그 이유는 무엇이었을까요. 어떤 메시지를 전달하려 했고, 그 메시지는 우리 사회에 어떤 시사점은 던졌을까요. 뜨거운 공론장으로 부상했던 5월의 강남역 속으로 다시 가보시죠 !.!
◆ 이렇게 모으고 분석했습니다
뉴스래빗은 추모 쪽지 철거 하루 전인 지난달 21일 오전 10시까지 강남역 10번 출구 인근에 부착된 추모 쪽지 2618건을 수집해 데이터베이스(DB)화했다. 총 3만1829개 단어, 13만1705자 분량이다.
손글씨는 텍스트 데이터로 일일이 변환했다. 오픈소스로 공개된 형태소 분석기 'KoNLPy'에서 형태소 단위로 쪼갰다. 총 7만 994개 형태소 중 의미에 영향을 미치지 않는 품사(접두사, 접미사, 특수문자, 조사 등)을 제외하고, 3만7898개 단어를 최종 분석 모집단으로 삼았다.
# 최다 등장 : "삼가 고인의 명복을 빕니다"
분석 결과 추모 쪽지에 가장 많이 등장한 단어는 빌다(1084회), 명복(1069회), 고인(1021회), 삼가(847회)다. 모두 4021회로 형태소 모집단 3만7898개 중 10.58%를 차지했다.
많은 시민들은 비판과 문제 제기에 앞서 '삼가 고인의 명복을 빕니다'란 근조(謹弔) 문장으로 피해자에게 애도를 표했다. 다만 이 같은 근조는 세월호 침몰 사고, 구의역 용역업체 청년 사망 사건 등 주요 사건사고 발생 때 빠짐없이 등장한다. 메모 키워드 분석 상 다른 사건사고 애도와 차별화하는 표현은 아니이서 데이터적 함의는 크지 않다.
# 참여자 혹은 당사자 : 여자 혹은 여성
'빌다', '명복', '고인', '삼가'에 이어 많이 등장한 단어는 여자(480회)와 여성(476회)이다. 여성과 여자를 같은 의미로 보면 956회에 달한다. 여성 계층이 이번 추모 참여자의 대다수이고, 사건의 피해를 관찰자가 아닌 당사자 시각에서 바라본다고 해석할 수 있다. 남자(190회), 남성(57회)의 등장횟수의 약 5배에 달한다.
'여성'이 포함된 메모 내용에는 피살 이유가 '여성이라서'라는 점을 다수 언급했다. 여성 각자가 겪은 치안 불안 경험을 공유하며, 여성의 현실을 꼬집기도 했다.
# 혐오 : '0.63%' 논란 비해 적었다
이어 '미안(429회)', '세상(297회)', '당신(295회)', '살아남다(290회)', '살다(280회)', '행복(245회)', '혐오(241회)' 등의 단어가 많이 등장했다. 이번 사건의 사회적 쟁점으로 떠올랐던 '여성 혐오'는 실제 빈도수가 높지 않았다. '여성 혐오'가 직접 언급된 메모는 최대 241개로 전체의 0.63%에 불과했다. 다만 '여성 혐오' 키워드가 등장하지 않더라도 사회적 약자인 여성을 노린 혐오 범죄라는 주장과, 여성 혐오와 무관한 '묻지마 살인'이라는 논리의 메모는 존재했다. ▶ 뉴스래빗 분석 단어 빈도수(전체) 확인
# 5대 키워드 그리고 연결망 : 미안, 꿈, 꽃, #, 사회
뉴스래빗은 최종 분석 결과를 바탕으로 횟수 기반 키워드 이외 5대 키워드 '미안', '꿈', '꽃', '#', '사회'를 따로 선정했다. 빈도 상위 단어 중 이번 살인 사건을 다른 사건과는 차별화한 시각으로 표현한 단어들이었다. 또한 이들 단어는 여성 피해자에 대한 애도 감정을 증폭하고, 문제 해결을 위한 시민 공감대를 형성하는데 크게 기여했다.
한 메모 안에 5대 키워드와 다른 언급 상위 단어가 함께 등장한 횟수를 집계한 후 각 5대 키워드를 중심에 놓고 연결망을 그렸다. 아래 5개의 연결망은 5대 키워드가 각 메모에서 주로 어떤 맥락의 단어들과 함께 등장했는지 보여준다. 데이터 시각화엔 구글의 '퓨전 테이블(fusion tables)'을 활용했다.
# 키워드1 '미안' : 강남역 애워싼 산 자의 감정
미안(429회)은 감정을 드러낸 단어 중 횟수가 가장 많았다. 의미가 같은 '죄송'의 등장 횟수(107회)와 합하면 536회에 달했다. 쪽지에 '미안'과 함께 등장한 주요 단어는 '지키다'(108회), '여자'(77회), '세상'(70회), '살아남다'(62회) 등이었다.
"지켜주지 못해 미안합니다", "나는 오늘도 살아남았습니다. 미안합니다", "대한민국 남자라 미안합니다. 그 죗값 평생 안고 가겠습니다", "이렇게 돌아가시게 만드는 세상의 구성원이어서 죄송합니다" 등의 내용이 많았다. "운 좋게 살아남은" 같은 여성으로서 피해자에 대한 막연한 미안함을 드러내는 글이 많았다. 지난 5월 강남역 10번 출구를 애워싼 추모자들의 주요 감정이던 셈이다.
↑ '미안' 단어 연결망. 각 원은 등장 횟수가 많을수록 크다. 왼쪽 +, - 버튼으로 연결망을 확대 및 축소할 수 있다. 상단 입력 숫자만큼 연관어 연결망을 표시할 수 있다.
# 키워드2 '꿈' : 가해자 아닌 피해자의 꿈이 중요해
살인 피의자 남성 김모씨(34)가 당초 신학원에서 목사를 꿈꿨다는 식의 보도가 쏟아지자 시민은 분노했다. 피해자의 꿈은 온데간데 없이, 가해자의 관점과 미래가 더 부각된다는 비판이었다.
‘꿈(133회)’이 등장한 메모 이면에는 살인범의 꿈부터 알게 된 시민의 불편함이 새겨져 있다. '꿈' 연결망을 보면 그 맥락을 읽을 수 있다. 가해자가 아닌 피해자의 꿈을 알리고, 못이룬 꿈을 하늘에서라도 이루길 바라는 내용의 단어와 다수 연결됐다. ‘당신(46회)’, ‘이루다(33회)’, ‘가해자(18회)’, ‘궁금(17회·궁금하다, 궁금해하다 포함)’ 등이었다.
↑ '꿈' 단어 연결망. 각 원은 등장 횟수가 많을수록 크다. 왼쪽 +, - 버튼으로 연결망을 확대 및 축소할 수 있다. 상단 입력 숫자만큼 연관어 연결망을 표시할 수 있다.
# 키워드3 '꽃' : "꽃다운 나이에 vs "여자는 꽃이 아니다"
20대 초반 생을 마감한 피해자를 두고 '꽃(118회)'이라는 표현이 다수 등장했다. "더 아름다운 꽃이 어울릴 사람", "수천 송이 꽃을 놓는다 해도 네가 걸을 앞날보다 빛나고 아름다웠을까", "피지도 못한 어여쁜 꽃" 등 강남역 10번 출구에서 피해 여성은 '피지 못한 꽃'이 됐다.
반명 여성 피해자를 꽃에 비유한 메모에 불편함을 호소하는 내용도 많았다. "꽃이 죽은 게 아닙니다. 한 사람이 죽은 겁니다", "여성은 꽃이 아닙니다" 등 '여자=꽃'으로 보는 시각에 문제 제기를 하기도 했다.
'꽃'은 남녀 불문 젊음과 청춘을 비유할 때도 쓰인다. 다만 '여성 혐오' 감점이 사건 쟁점으로 불붙으면서 '꽃=여성' 대상화 자체가 한국 사회의 남성 중심적 시각이라는 비판으로 이어졌다.
↑ '꽃' 단어 연결망. 각 원은 등장 횟수가 많을수록 크다. 왼쪽 +, - 버튼으로 연결망을 확대 및 축소할 수 있다. 상단 입력 숫자만큼 연관어 연결망을 표시할 수 있다.
# 키워드4 '#(해시태그)' : 강렬한 한마디…온·오프라인 연결
등장 빈도가 높은 단어들 가운데 눈에 띄는 키워드는 #, 해시태그(123회)였다. 최근 페이스북 인스타그램 등 주요 사회관계망서비스(SNS)에서 동일 주제의 글을 잇는 링크 역할 ?한다. 또한 젊은 층이 특정 표현이나 주장을 SNS에 부각할 때 주로 쓴다. #강남역추모 #헬조선 처럼 말이다. 당초 특수문자는 최종 분석 대상에서 제외했지만 #만큼은 포함한 이유다.
추모 내용을 온라인처럼 #을 달아 손글씨로 썼다. '#살아남았다', '#강남살인남', '#살女주세요' 등이 대표적이었다. 이번 사건을 바라보는 주제의식을 짧고 강렬하게 표현하고 전달하는데 기여했다. 주요 키워드의 생명력을 유지하는데도 도움이 됐다. 나아가 이런 해시태그 글을 시·공간을 넘어 온라인으로 추모 열기를 매개하는 역할을 하기도 했다.
↑ '#' 단어 연결망. 각 원은 등장 횟수가 많을수록 크다. 왼쪽 +, - 버튼으로 연결망을 확대 및 축소할 수 있다. 상단 입력 숫자만큼 연관어 연결망을 표시할 수 있다.
# 키워드5 '사회' : 쪽지가 던진 사회 메시지는
시민 다수는 이번 사건이 개인의 비극일 뿐이라고 생각하지 않았다. 한 개인이 허무하게 죽은 오늘을 슬퍼하는 데 머무르지 않고, 사회와 미래를 거론했다. 살아남은 자들의 의무는 내일의 우리, 그리고 미래의 사회를 더 나은 곳으로 바꿔나가는데 있다고 주장이 많았다.
그래서 '사회(128회)' 연결망에는 데이터 전체에 걸쳐 자주 등장한 단어들이 망라돼있다. 여성(98회), 혐오(74회), 피해자(41회), 약자(22회), 미안(21회), 책임(21회), 공포(18회), 살해(17회) 등 이번 사건을 아우르는 전반적 키워드들이 즐비했다. 5월의 강남역 10번 출구를 달궜던 추모 열기가 개인 혹은 여성, 특정 단체가 아닌 우리 사회 전반의 문제 의식으로 확장하는 셈이었다.
↑ '사회' 단어 연결망. 각 원은 등장 횟수가 많을수록 크다. 왼쪽 +, - 버튼으로 연결망을 확대 및 축소할 수 있다. 상단 입력 숫자만큼 연관어 연결망을 표시할 수 있다.
# 2618건 강남역 추모 메모 모두 공유합니다
현재 추모 메모는 서울 대방동 여성플라자와 서울시민청에 보관 중입니다. 서울시 측도 정확한 메모 수는 모른다고 합니다. 전국 각지 추모 메도 대두분도 여성플라자에 보관 중입니다.
뉴스래빗 '5월 강남역 하늘로 부친 메시지… 미안, 꿈, 꽃, #, 사회' 제작을 위해 수집한 시민 추모 메모글 2618건 내용을 모두 독자 여러분께 공유합니다. 이 데이터를 여러분 모두의 방식으로 분석해보세요. 뉴스래빗보다 더 건강하고, 발전적인 사회적 메시지를 찾으신다면 더 바랄 나위가 없겠습니다.
▶ [DJ 래빗] 2618건 강남역 추모 메모 모두 공유합니다
데이터 공개가 여성 혐오 논란과 약자 상대 폭력, 남녀 공용화장실 안전, 정신질환자 관리 등 방치됐던 우리 사회 문제를 해결하고, 보다 나은 사회를 만드는데 조금이나마 기여하길 바랍니다. 비극이 다시는 발생하지 않길 빕니다. 다시 한번 삼가 고인의 명복을 빕니다.
# DJ 래빗 ? 뉴스래빗이 고민하는 '데이터 저 罐??Data Journalism)' 뉴스 콘텐츠입니다. 도처에 잠들어있는 자료들을 수집하고, 걸러내고 분석해 새로운 의미와 생명력을 부여하려고 합니다. 어렵고 난해한 데이터 저널리즘은 줄임말 'DJ'로 써보겠습니다. 음악 디제잉(DJing)하듯 뿔뿔이 흩어진 자료와 의미를 신나게 엮여보려고 합니다.
'뉴스래빗'의 다른 실험적 뉴스를 만나보세요 !.!
책임= 김민성 기자, 연구= 강종구 한경닷컴 기자 jonggu@hankyung.com
뉴스래빗 페이스북 facebook.com/newslabit
기사제보 및 보도자료 newslab@hankyung.com
[한경닷컴 바로가기] [스내커] [한경+ 구독신청]
ⓒ 한국경제 & hankyung.com, 무단전재 및 재배포 금지
뉴스