온라인동영상서비스(OTT) 시장에서 왓챠의 위상은 독특하다. 우선 넷플릭스, SK텔레콤, CJ, KT, 카카오 등 대기업 경쟁사 속에서 유일한 스타트업이다.
태생도 다르다. 다른 대다수 기업은 처음부터 콘텐츠 ‘공급’에 치중했다면 왓챠는 콘텐츠 데이터 ‘분석·추천 서비스’가 시작이었다. 왓챠의 인공지능(AI) 기반 ‘예상 별점’ 서비스는 ‘나보다 내 취향을 더 잘 안다’는 평가와 함께 회사의 차별화된 강점으로 꼽힌다. 이는 앱 누적 다운로드 수 1000만 건, 올 상반기 매출(334억원) 210% 증가 등 성공의 든든한 토대가 되기도 했다.
회사의 AI 추천 시스템 개발·운영을 총괄하는 윤정민 왓챠 머신러닝팀장은 12일 한국경제신문과의 인터뷰에서 “왓챠의 AI 역량은 OTT업계 최고 수준이라고 자부한다”며 “추천 시스템을 고도화하고 서비스 영역을 넓혀 고객의 콘텐츠 이용 즐거움을 배가시킬 것”이라고 말했다.
6억 개 빅데이터가 왓챠 AI의 힘
왓챠의 앱 ‘왓챠피디아’에 들어가면 자신이 안 본 영화·드라마에 대한 예상 별점을 볼 수 있다. 2011년 서비스 초기 때는 부정확하다는 평가도 있었으나 지금은 ‘웬만하면 맞힌다’는 평가가 지배적이다. 윤 팀장은 “현재 예상 별점과 실제 별점의 차이가 평균 0.5점(5점 만점)으로 상당히 정확하다”고 강조했다. 예상 별점과 별개로 개인별 콘텐츠도 추천해주는데 이 역시 만족도가 높다. 왓챠에서 소비되는 콘텐츠 가운데 70% 이상이 추천 작품이라는 게 이를 방증한다. 이는 고객의 만족스러운 콘텐츠 소비→왓챠 신뢰도 상승→구독 서비스 ‘왓챠플레이’ 유입 등 선순환으로 이어진다는 게 윤 팀장의 설명이다.이 모든 것을 가능하게 한 힘은 회사의 AI 역량에 있다. 윤 팀장은 “AI 성능은 데이터의 양과 질, 우수한 AI 알고리즘이 좌우한다”며 “왓챠는 두 분야 모두 강한 경쟁력을 갖추고 있다”고 했다. 데이터의 경우 지금까지 쌓인 별점 데이터가 6억2000만 개에 이른다. 네이버 영화 별점 데이터의 50배가 넘는다. 윤 팀장은 “왓챠 고객은 좋은 콘텐츠를 추천받고 싶다는 의도로 정확하게 별점을 매기기 때문에 데이터의 질도 높을 수밖에 없다”고 했다.
언어모델까지 접목해 AI 성능 향상
AI 분석엔 고도로 복잡한 딥러닝(심층학습) 모델을 적용하고 있다. 윤 팀장은 “개인별 평점, 콘텐츠 시청 시간, 시청 중단 여부 등은 물론 다른 이용자와의 취향 유사성까지 분석한다”고 했다. 이어 “좋은 AI 모델이 나오면 왓챠 시스템에 맞게 커스터마이즈해 추천 엔진을 진화시키고 있다”며 “최근엔 구글의 AI 언어모델 버트(BERT)를 접목했다”고 소개했다. 버트는 2018년 공개되자 ‘AI의 언어 이해·처리 능력을 한 단계 끌어올렸다’는 평가를 받은 모델이다. 데이터의 순서·맥락까지 세밀하게 분석하는 게 장점인데, 이를 취향 분석에 접목하자 한층 섬세한 추천이 가능해졌다는 것이 윤 팀장의 설명이다.왓챠의 AI 데이터 분석은 콘텐츠 도입 등 의사결정에도 도움을 주고 있다. 왓챠가 단독 공급하는 ‘왓챠 익스클루시브’ 콘텐츠는 유난히 성공률이 높다는 평가를 받는다. 미국 HBO의 체르노빌, 왕좌의 게임, BBC의 킬링 이브, CBS의 와이 우먼 킬 등이 대표적이다. 윤 팀장은 “막연히 ‘이 작품은 성공하겠지’라는 기대가 아니라 광범위한 데이터를 기반으로 콘텐츠 도입 여부를 결정하기 때문에 성공률이 높다”고 했다.
이외에 왓챠 AI는 왓챠피디아 내 사용자의 욕설 등 부적절한 표현을 자동으로 감지하고 노출을 막는 역할도 하고 있다.
윤 팀장은 “음악, 공연, 웹툰 등 비영상 콘텐츠도 AI 추천 엔진을 개발하고 있다”며 “회사의 AI 솔루션을 문화산업 전반으로 확산시킬 것”이라고 강조했다.
■ 윤정민 팀장은
△1986년생
△포스텍 컴퓨터공학부 학사, 박사
△왓챠 연구개발(R&D)팀
△왓챠 머신러닝팀장
서민준 기자 morandol@hankyung.com