데이터라벨링은 인공지능(AI)이 데이터를 알아볼 수 있게 만드는 작업이다. 사진이나 영상이 어떤 데이터인지 AI는 스스로 알 수 없다. 사람이 데이터라벨링을 통해 이 사진에 나오는 물체가 자동차인지, 기차인지 구별해주면 AI는 이를 학습해 자동차와 기차를 인지하기 시작한다. 고성능 AI를 확보하는 것이 모든 기업의 당면과제인 지금, 데이터라벨링 산업이 확장될 수밖에 없는 이유다. 2017년 설립된 크라우드웍스는 국내 데이터라벨링 업체 중 가장 확장 속도가 빠른 기업으로 손꼽히고 있다.
크라우드웍스는 ‘크라우드소싱’ 방식으로 데이터라벨링을 수행하는 기업이다. 직접 직원들이 데이터라벨링 작업을 하는 게 아니라 크라우드웍스 교육 프로그램을 이수한 사람이면 누구나 작업 플랫폼으로 진입해 데이터라벨링을 수행한다. 데이터라벨링을 전업으로 해 연 4000만원가량을 벌어가는 참여자들도 있다. 현재 크라우드웍스에 등록된 작업자는 25만 명에 달한다. 한 달에 한 건 라벨링 작업을 꾸준히 하고 있는 사람은 5만 명에 달한다.
비전문 인력이 참여해 품질 문제를 지적받는 크라우드소싱의 단점도 크라우드소싱으로 해결하고 있다. 기존 라벨링 우수 작업자들을 선발해 이들에게 검수 작업을 맡기는 방식이다. 박민우 대표(사진)는 “작업자와 검수자가 동시에 들어와 있는 크라우드소싱 플랫폼은 크라우드웍스가 최초”라며 “99% 품질 높은 데이터를 만들어내고 있다”고 강조했다.
이런 시스템을 발판으로 크라우드웍스는 성장 가도를 달리고 있다. 최초 투자한 네이버와는 설립 이후 100여 개의 프로젝트를 수행했다. 카카오, 삼성전자, KT, LG CNS 등 300개 이상의 기업 고객도 확보했다. 지난해 매출은 70억원으로, 전년(29억원)에 비해 두 배 넘는 성장을 기록했다.
지난해 크라우드웍스는 인력 매칭 사업도 시작했다. 기업 고객들은 긴밀하게 진행되는 프로젝트에서 데이터 보안을 철저히 지켜야 한다. 데이터라벨링을 크라우드소싱 플랫폼에 자유롭게 올려놓지 못할 수도 있다. 이럴 땐 직접 데이터라벨링 작업자들을 채용해야 한다. 이때 크라우드웍스는 지난 작업 결과를 바탕으로 우수한 인력을 기업 고객에 소개해줄 수 있다. 박 대표는 “크라우드웍스는 국내에서 어느 곳보다 작업자 인력 풀을 많이 보유하고 있다”며 “데이터라벨링 작업 분야마다 적합한 인재들을 추천해줄 수 있는 역량이 있다”고 말했다.
구민기 기자 kook@hankyung.com
뉴스