기자명 문병도 기자
  • 입력 2020.09.02 10:15

크라우드웍스, 2020 데이터 라벨러 현황 보고서 발간

[뉴스웍스=문병도 기자] 크라우드웍스가 국내 데이터 라벨러들의 활동 현황과 실태를 분석한 ‘2020 데이터 라벨러 현황 보고서’를 발간했다.

데이터 라벨러는 인공지능(AI) 학습에 필요한 데이터를 수집하고 가공하는 데이터 라벨링 작업을 전문으로 하는 새로운 직업 군이다. 

관련 업계에서는 국내에만 20만 명 이상이 종사 중인 것으로 추정하고 있다.

보고서는 크라우드웍스의 15만 활성 회원 데이터와 지난 7월 31일부터 8월3일까지 나흘간 국내에서 활동 중인 데이터 라벨러 2611명을 대상으로 진행한 온라인 설문조사 결과를 토대로 작성됐다.

직업과 관련해 데이터 라벨러의 절반 이상은 본업을 가지고 있는 다중 직업 종사자인 것으로 나타났다. 

데이터 라벨러의 본업으로는 일반 회사에 다니는 직장인의 비중이 가장 높았으며 이어 자영업자, 공무원 순으로 조사됐다. 

데이터 라벨링을 주요 결제활동으로 삼고 있는 데이터 라벨러 비율도 40%이상을 기록했다.

데이터 라벨러의 대다수는 온라인 환경에 익숙하며, 최신 트렌드의 영향을 많이 받는 것으로 조사됐다. 

데이터 라벨링에 대한 정보를 처음 알게 된 경로는 네이버와 구글, 유튜브, 인스타그램 등 온라인이 대부분을 차지했다. 지인의 추천을 받아 데이터 라벨링을 시작했다는 비율도 20% 이상으로 나타났다.

국내 데이터 라벨링 시장의 경우 아직은 공급 대비 수요가 우세한 것으로 분석됐다. 

데이터 라벨러의 과반수는 데이터 라벨링 작업에 참여하기 위해 플랫폼에 상시 접속하고 있지만 일평균 작업 시간은 2시간 미만으로 집계됐다.

라벨링 작업 선택 기준으로는 수익과 직간접적으로 연관된 보상과 난이도, 시간 등을 고려하는 것으로 나타났다. 

작업 데이터 역시 이미지와 텍스트 등 비교적 수집과 가공이 간편한 유형을 선호하는 것으로 조사됐다.

인공지능 기술의 고도화에 따라 적합성과 신뢰성 높은 데이터 수요가 증가하면서 데이터 라벨러의 전문성도 동반 상승하고 있다. 

크라우드웍스의 활성 회원 3명 중 1명은 국가공인과 어학 등 전문 자격증을 보유하고 있으며 전문성과 관심이 있는 분야의 데이터 라벨링 작업을 선호하는 것으로 나타났다.

박민우 크라우드웍스 대표는 “인공지능 기술의 고도화를 위해서는 사람의 개입이 필수 적이고 사람의 삶을 윤택하게 하기 위해서는 고도화된 인공지능 기술이 필요하다”라며 “크라우드웍스는 이런 선순환 구조의 초석을 다지는 데이터 라벨러를 위해 플랫폼 노동의 새로운 패러다임을 제시하도록 앞장서겠다”라고 말했다.

크라우드웍스의 ‘2020 데이터 라벨러 현황 보고서’는 홈페이지에서 다운로드할 수 있다. 

저작권자 © 뉴스웍스 무단전재 및 재배포 금지