[한경잡앤조이=강홍민 기자/백승훈 대학생 기자] #.노트북 화면에 자동차 여러 대가 눈에 보인다. 이번 ‘업무’의 내용은 ‘이미지 바운딩’이다. 화면에 보이는 사물을 찾아 마우스로 네모 박스를 만들어 표시해야한다. 막상 해보니 영 까다로운 것이 아니었다. 조금만 범위를 잘못 설정해도 ‘반려’ 메시지가 떴다. 한 10분 정도 지났을까, 눈이 빠지도록 모니터와 씨름한 끝에 제출한 데이터가 결국 통과됐다. 수익 내역에 수 백원 남짓한 돈이 모였다.4차 산업혁명 시대의 ‘신직업’, 데이터 라벨러란?10월, 사흘 동안 데이터 노동을 체험해봤다. 정확히 표현하면 ‘데이터 라벨링’ 업무다. 데이터 라벨링이란, 데이터에 ‘라벨’을 씌워주는 작업이다. 인공지능은 텍스트나 사진 등의 현실 데이터를 스스로 식별할 수 없어 사람이 ‘학습’을 시켜줘야 한다. 예를 들어, 자동차 이미지를 찾아 ‘자동차’ 라벨을 붙이면 인공지능이 이를 인식해 학습하고 알고리즘 고도화에 필요한 데이터를 축적하는 것이다. 대부분의 데이터 라벨링 플랫폼이 ‘크라우드소싱(Crowd Sourcing)' 형태로 인력을 구하는 이유가 바로 여기에 있다. 인공지능이 얼마나 데이터를 학습했는지가 곧 인공지능이 제공하는 서비스의 퀄리티와 직결되기 때문이다. 자율주행 자동차, 음성 인식, 텍스트 자동완성 등의 인공지능을 활용하는 기술이 많아짐에 따라 데이터 노동 수요 또한 급속도로 늘고 있다. 올 9월 ’알바콜‘이 직장인 581명을 대상으로 ’데이터 일자리‘에 대해 설문조사를 진행한 결과, 80.9%가 ’데이터 일자리에 아르바이트 또는 부업으로 지원할 의사가 있다‘고 나왔다. △기사 요약 업무 캡쳐.직접 데이터 라벨링을 체험한 모 기업 홈페이지의 대문엔 활동 중인 작업자가 약 17만 명에 달한다고 소개돼 있었다. 이 수치를 입증하듯 대학생들 사이에서도 데이터 라벨링을 경험해본 사람을 어렵지 않게 볼 수 있었다. 한 대학생은 ‘에브리타임’에서 데이터 라벨링 플랫폼 업체의 구인공고를 보고 참여하게 됐다고 말했다. 그는 “건당 500원을 받고 기사 한 편을 ‘세 줄 요약’하는 일”을 했다며, “다른 라벨링 업무보다 단가가 높은 대신 가이드라인이 까다롭고 업무 난이도도 높아 오래 하진 않았다”고 말했다. 프리랜서와 아르바이트 사이에 있는 일자리? 기자가 체험한 데이터 라벨링 업무 형태는 다양했다. 업무 시작 전 약 30분 정도 교육을 이수하면 낮은 숙련도를 필요로 하는 ‘텍스트 태깅’과 ‘이미지 바운딩’에 참여할 수 있었다. 단가도 가장 낮고, 업무 강도도 약한 탓인지 얼마 안했다고 생각했는데, ‘더 이상 작업을 할 수 없다’는 메시지가 나타나며 작업 창이 닫혔다. 시작한 지 약 10분밖에 흐르지 않았다. △라벨링업무 캡쳐.당장 할 수 있는 동일한 업무가 있는지 찾아봤으나 허사였다. 아마 이 업무는 개인이 하루에 처리할 수 있는 할당량이 정해진 듯 보였다. 단순하게 일한 시간을 놓고 따져 보면 최저시급에 못 미치는 결과였다. 다른 라벨링 업무를 찾아보니 강아지 음성 수집이나 인물 사진 촬영 등의 특정 조건을 만족해야 하는 업무들이었다. 정해진 사무실로 출퇴근을 해야 하거나 전문적인 어학능력이 요구되는 업무도 있었다. ‘시간과 공간에 제약을 받지 않고 노트북이나 스마트폰 하나면 돈을 벌 수 있다’는 데이터 라벨링 업무의 홍보 문구와는 거리가 멀었다. △수익금 캡쳐.어쩔 수 없이 하루에 10분씩, 단순 라벨링 업무를 반복했다. 사흘 동안 1800원 정도가 모였다. 분명 만족스러운 결과는 아니었다. 돈을 더 벌기 위해선 다양한 활동에 적극적으로 참여할 필요가 있었다. 실제 라벨링 업무로 약 10만원의 수익을 올린 한 네이버 블로거 A씨는 “소요되는 시간은 짧지만 보상이 큰 업무에 집중해야 한다”고 말했다. 그는 식단프로그램을 만들기 위한 데이터 수집 프로젝트에 참여했는데, 한 달 동안 하루종일 먹는 음식을 세 방향으로 촬영해 7만원을 벌었다고 말했다. 이어 A씨는 “이런 프로젝트는 가끔 주어지고 대부분 업무가 비정기적으로 진행되다 보니 주된 직업으로 삼기는 힘들다” 라며 “월급 외 부수입으로 생활비에 보태자는 생각으로 시간 대비 수익률이 높은 업무만 골라서 하고 있다”라고 덧붙였다. △블로거 A씨의 수익금 캡쳐.정부가 주도하는 ‘10만 데이터 라벨러 양성’, 일자리 창출 효과엔 ‘과연’문재인 정부는 7월 한국판 뉴딜 정책을 발표하며 “데이터 라벨링을 하기 위한 청년 일자리를 10만 개 창출할 것”이라고 발표했다. 정부가 내세운 디지털 뉴딜의 핵심 사업이 ‘데이터 댐’ 구축인데, 이에 필요한 데이터 라벨링 업무를 청년들에게 제공함으로써 청년 취업난을 해결해보겠다는 전략으로 풀이된다. 하지만 실제 체험한 데이터 라벨링은 단순 반복 작업이 대다수를 차지했을 뿐더러 비정기적으로 진행할 수 있는 업무 탓에 수입이 매우 불안정했다. 전문가들 사이에선 이미 정부의 ‘10만 데이터 라벨러 양성 계획’을 두고 ‘질 낮은 단기 일자리만 늘어나게 될 것’이라는 비판이 제기되기도 했다. 데이터 라벨링 일자리의 긍정적인 측면에 주목해야 한다는 목소리도 있다. 한국판 뉴딜 종합계획에 따르면 AI 데이터 시장 전망 규모는 2020년 약 17조원에서 2025년 43조원으로 두 배 이상 성장할 것으로 예측됐다. 데이터 라벨링 수요는 더 커질 것이고 점차 양질의 일자리가 많이 등장할 것이라는 내용이다. khm@hankyung.com< 저작권자(c) 캠퍼스 잡앤조이, 당사의 허락 없이 본 글과 사진의 무단 전재 및 재배포를 금합니다. >