기자명 문병도 기자
  • 입력 2020.07.24 06:00

[뉴스웍스=문병도 기자] 과학기술정보통신부는 인공지능(AI) 기반의 디지털 뉴딜 사업의 일환으로 한국과학기술정보연구원(KISTI)이 축적해 온 논문 등을 대상으로 대규모 과학기술 기계학습 데이터 구축사업을 시작한다.

사업은 재택근무를 통해 비대면으로 진행되며, 만 19세에서 34세 이하의 청년층을 대상으로 이달 25일부터 내달 10일까지 1차 모집하여 올해 12월까지 시행될 예정이다.

국내논문과 국가R&D보고서 원문을 대상으로 과학기술분야 기계학습 데이터 5종을 구축하며 최대 425만여 건의 과학기술 기계학습 데이터가 사업물량이다. 

데이터 구축은 코로나19 상황이므로 온라인 시스템을 활용하여 비대면으로 진행하되, 데이터 품질 부실화를 방지하기 위하여  크라우드소싱 기반 검증 방식을 적용한다.

대규모 과학기술 공공데이터를 구축하게 되면 KISTI의 사이언스 온에서 인공지능(AI) 서비스운영을 통해 수요자에게 제공한다. 텍스트, 영상, 음성 등 다양한 분야의 데이터 레이블러 수요 증가에 따라 데이터 수집·가공 관련 기업에서의 활발한 활용이 예상된다.

과학기술분야 기계학습 데이터가 구축·개방 되면, 과학기술분야  지식자원의 지능적 연계 및 융합연구 지원과 중소기업 기술혁신을 위한 의사결정 및 비즈니스 활용이 가능해질 것으로 예상된다.

권석민 과기정통부 과학기술일자리혁신관은 “기계학습을 위한 데이터 구축은 학술정보에 대한 접근성을 향상시켜 4차 산업혁명 시대의 근간인 DNA을 위한 데이터댐 건설에 주춧돌이 될 것”이라고 밝혔다.

 

저작권자 © 뉴스웍스 무단전재 및 재배포 금지