(▲ 사진 = 문성원 루빅스 PM(좌), 성인재 루빅스 TF장(우))
우리나라 국민 10명 중 6명은 주로 포털사이트를 통해 뉴스를 접한다. 언론사 사이트나 뉴스 앱을 통해 뉴스를 접하는 사람은 13%에 불과하다. 포털을 언론사로 생각하는 사람들의 비중도 그렇지 않다는 사람을 크게 앞섰다. 포털의 뉴스 장악력이 커졌다는 의미다.
하지만 포털은 궁극적으로 언론사가 아니다. 전통적인 저널리즘 가치를 추구하기 보다는 이익을 위해 더 많은 이용자 수 확보에 무게를 두기 때문이다.
국내의 대표적인 포털사이트인 네이버와 다음이 뉴스 소비자를 끌어들이기 위한 새로운 실험에 들어갔다. 인공지능 알고리즘을 활용해 더 많은 이용자를 포털에 유입시키고 더 오랜 시간을 머물도록 하는 것이 목표다.
우선
카카오는 지난 4일부터 메인화면에 노출되는 기사에 루빅스의 열독률 지수를 적용했다. 루빅스가 우리에게 어떤 방식으로 기사를 보여주는지 성인재 루빅스 TF장과 문성원 루빅스 PM을 만나 들어봤다.
▲ 우리가 무슨 뉴스를 봐야하는지 인공지능이 골라준다고?카카오는 지난 2015년 6월 개인화 뉴스 추천을 내세운 루빅스를 다음앱에 적용했다. 랭킹 카테고리의 ‘꼼꼼히 본 뉴스’가 루빅스 적용의 대표적인 예다.
카카오가 루빅스의 적용범위를 확대하면서 우리가 보는 모바일 다음의 메인화면은 이제 인공지능이 나의 관심사를 파악해 추천해주는 화면으로 진화했다. 과연 인공지능은 어떤 기준으로 이 기사들이 나의 관심을 끌 것이라고 판단했을까.
루빅스는 클릭될 확률이 높은 기사를 찾아내는 알고리즘이다. 우선 사용자를 그룹으로 나눈다. 예를 들어 당신이 야구를 좋아한다면 루빅스는 당신에게 야구와 관련된 기사를 더 많이 보여준다. 만약 당신이 더 많은 뉴스 읽기 활동을 한 뉴스 소비자라면 보다 더 취향에 맞는 기사가 메인에 노출되는 방식이다. 또 개개인의 취향을 반영해 추천하는 개인화 알고리즘이 적용돼 있다. 개인화는 많은 사용자들의 주목을 받지는 못하지만 나에게는 관심이 있을만한 기사를 추천해주기 때문에, 사용자그룹 맞춤과는 상호보완적이다.
하지만 여전히 풀리지 않는 의문이 있다. 소비자들의 개인적인 취향에만 맞춰 추천하다보면 사용자의 취향을 벗어난 새로운 사건은 노출될 가능성이 크게 줄어들게 된다.
예컨대 최근 문제가 되고 있는 여중생 폭행 사건은 과거엔 없었던 사건이기 때문에 취향이 존재할 수 없다. 또 북핵 문제와 같은 속보성 기사도 알고리즘으로 대응하기 어려운 부분이다.
그렇다면 루빅스는 새로운 사건이 발생했을 때 중요도를 어떻게 판단할까. 문성원 PM은 인공지능이 사람의 직관을 따라오는 수준은 아니라고 이야기 했다.
“루빅스는 자동화로 추천해줄 수 있는 영역을 맡습니다. 그 이외에 해결되지 않는 부분인 속보 등은 사람이 손을 볼 수밖에 없죠.”
▲ 카카오가 루빅스 도입으로 노리는 것
카카오는 루빅스를 도입의 취지를 “인공지능이 사람의 관심사를 반영해 각기 다른 기사를 보여주는 뉴스추천을 하기 위함”이라고 설명했다. 문 PM은 루빅스 개발이 ‘어떻게 하면 버려지는 뉴스를 최소화 할 수 있을까’를 고민하던 중 나온 아이템이라고 말했다.
“처음엔 모든 사람이 한 화면에서 같은 뉴스를 봤습니다. 뉴스라는 특성을 생각해보면 이상한 부분은 아니죠. 그런데 좋은 기사임에도 관심을 가지는 사람이 적다고 판단되면 노출되지 못하는 기사가 대부분입니다. 그런 기사는 어쩔 수 없이 버려질 수밖에 없는 거죠.”
카카오는 하루에만 3만 건이 넘는 기사를 전송 받는다. 20개 정도의 뉴스만 노출할 수 있는 모바일 환경에서 좀 더 많은 기사를 사람들에게 읽히게 만들기 위해선 관심도가 높은 기사 위주의 추천시스템이 필요했다.
하지만 사람의 힘으로 모든 기사를 일일이 확인하고 개인의 취향에 맞춰 기사를 선정하는 것은 불가능했다. 루빅스는 이러한 문제를 해결하고자 등장한 서비스다.
루빅스의 핵심 기능은 열독률이다. 열독률이란 사람들이 기사를 얼마나 열심히 읽었는지를 측정하는 지표다. 본문 내 글의 길이와 이미지 개수를 기준으로 평균 체류시간을 계산한다. 평균 체류시간보다 높으면 기사를 꼼꼼히 본 것으로 판단, 열독률 지수는 높아진다. 반면 평균 체류시간보다 낮으면 열독률 지수는 낮아지는 구조다.
열독률이 높은 기사는 유입률이 높은 상위에 배치된다. 품질이 좋은 기사를 골라 노출해 줘 뉴스 소비자들의 충성도를 높인다는게 카카오의 전략이다. 실제로 루빅스 도입 이후 뉴스 이용자 수는 2015년 11월 1,910만 명에서 2,710만 명으로 42%늘었다.
결국 뉴스 소비자들에게 질 좋은 기사를 제공함으로써 더 많은 사람들이 카카오 플랫폼 안에서 더 오랫동안 머물게 하는 게 루빅스 도입의 목표인 셈이다.
▲ 알고리즘은 사람을 대체할까?인공지능 알고리즘은 카카오만이 주목하는 분야는 아니다. 네이버도 최근 에어스(Airs)라는 인공지능 서비스를 론칭해 테스트하고 있다. 네이버와 카카오 등 IT기업이 이처럼 알고리즘 개발에 열을 내는 이유가 무얼까.
이는 언론사의 잘못도 한 몫을 거든다. 트래픽을 끌어들이기 위해 쏟아내는 어뷰징 기사와 베껴쓰기 기사 사이에서 흙 속 진주 같은 기사를 찾기 위한 포털의 나름의 노력인 셈이다.
플랫폼 이용자들에게 읽을 가치가 있는 기사를 골라주는 게이트키퍼 역할을 이제는 인공지능 알고리즘이 담당하는 시대가 온 것이다. 그렇다면 인공지능 알고리즘 개발진이 생각하는 좋은 기사란 어떤 기사일까?
성인재 TF장은 전통적 관점에서 잘 쓴 기사가 루빅스 순위도 높다고 말한다. 열독률 지수가 적용됐기 때문이다. 그는 “좋은 뉴스를 정의하기는 어렵죠. 다만 저희의 목적은 사용자에게 필요한 뉴스, 읽고 싶은 뉴스를 주는 게 목적”이라고 설명했다.
문성원 PM은 “루빅스는 제목과 본문을 모두 고려하는 알고리즘”이라며 “송출되는 기사의 본문 만족도를 정량화 하고 이를 통한 소비자들의 만족도를 높이는 게 목표”라고 강조했다. 결국 뉴스 소비자들이 저품질 기사에 실망하는 대상은 플랫폼과 언론사 둘 다이기 때문이다.