기자명 문병도 기자
  • 입력 2021.06.18 15:35

과기정통부, 헬스케어·자율주행 등 170종 데이터 18일 개방

[뉴스웍스=문병도 기자] 음성 인공지능(AI)이 경상도·전라도 등 각 지역 방언을 정확히 인식할 수 있도록 한국어 사투리 데이터가 풀린다. 

과학기술정보통신부와 한국지능정보사회진흥원(NIA)은 인공지능 학습용 데이터 8대 분야 170종을 '인공지능(AI) 허브'에 18일부터 개방한다고 발표했다. 

개방 데이터 분야 별로는 음성·자연어(한국어 방언 등 39종), 헬스케어(암진단 영상 등 32종), 자율주행(도로주행영상 등 21종), 비전(스포츠 동작 영상 등 15종), 국토환경(산림수종 이미지 등 12종), 농축수산(가축행동 영상 등 14종), 안전(노후 시설물 이미지 등 19종), 기타(패션상품 이미지 등 18종) 등으로 구성됐다.

이달 30일 공개를 앞두고 있는 한국어 방언(경상·전라·충청·강원·제주) 발화 데이터는 표준어에 비해 사투리를 잘 인식하지 못하던 음성 기반 인공지능(AI) 서비스의 문제점을 해결할 수 있을지 주목된다.

데이터 개방 전 활용성 검토 결과 "자연스러운 방언이 수집됨", "기존 서비스의 인식률이 12% 향상됨" 등의 긍정적 반응이 나왔다.

자율주행 데이터(21종)는 주차 장애물·이동체 인지 영상, 버스 노선주행 영상 등 기존과 차별화된 데이터를 포함했다. 활용성 검토 결과 "특수 차선, 장애물, 포트홀 등 다양한 객체가 포함" 등이 대표적인 장점으로 꼽혔다.

데이터들이 실제 현장에서 혁신적으로 활용될 수 있도록 과기정통부는 18일 '인공지능(AI) 데이터 활용협의회' 출범식을 개최했다. 주요 참여 기업은 삼성전자, 현대차, SK텔레콤, LG, KT, 네이버 등이다. 이들은 AI 허브 데이터 적극 활용 및 피드백을 통해 지속적으로 데이터 품질을 개선하고, 신규·추가 과제 기획 등에 협력할 예정이다.

한편, 데이터댐은 정부가 2020년 7월 14일 확정·발표한 정책인 ‘한국판 뉴딜’의 10대 대표 과제 중 하나다. 10대 대표 과제는 디지털 뉴딜(3개), 그린 뉴딜(3개), 융합과제(4개)로 구성돼 있는데, 데이터 댐은 디지털 뉴딜 분야에 속한다.

데이터댐은 데이터 수집·가공·거래·활용기반을 강화해 데이터 경제를 가속화하고, 5G 전국망을 통한 전 산업 5G와 AI 융합을 확산시키는 것이다. 이를 위해 2022년까지 총사업비 8조5000억원을 투자해 일자리 20만7000개를 창출하며, 2025년까지는 총사업비 18조1000억원을 들여 일자리 38만9000개를 창출한다는 계획이다.

저작권자 © 뉴스웍스 무단전재 및 재배포 금지