기자명 문병도 기자
  • 입력 2022.02.28 00:10

공개된 공공데이터 늘었지만, 활용도 낮아…"필요한 데이터 없다"
데이터 3법·데이터산업법 시행 불구 민간 데이터 활용에 그쳐
전문가들 "차기정부, 공공데이터 개방 범위 대폭 확대" 한목소리

오픈데이터 바로미터(ODB)에 따르면 올해 공공데이터 개방도 평가에서 영국과 캐나다가 공동 1위, 호주가 3위, 우리나라와 프랑스가 공동 4위를 차지했다. 하지만 세부적으로 들어가면 사정이 180도 달라진다. (사진=ODB캡처) 

[뉴스웍스=문병도 기자] 새 정부는 디지털 대전환 시대 한국을 게임 체인저로 만들어야 한다. 글로벌 선도 국가 도약을 위해 정보통신기술(ICT)을 활용해 디지털 혁신에 나서야 한다.

디지털 혁신이란 국가와 기업이 모든 유형의 서비스에서 디지털 기술을 이용하여 역동적으로 변화하는 시장의 수요에 맞게 비즈니스 프로세스, 문화, 고객 환경을 조성하거나 수정하는 과정을 말한다. 디지털 혁신은 기업과 정부의 지속가능성을 보장하는 핵심 키워드라고 할 수 있다. IT분야 시장분석 기관인 IDC는 오는 2023년 전세계 명목 GDP의 절반 이상인 53.5조 달러를 디지털 혁신 기업이 차지할 것으로 전망했다.

◆데이터 활용에 디지털 혁신 성패 결정…공공데이터 활짝 연 미국·영국

디지털 혁신의 성패는 데이터 활용에 달렸다. 

글로벌 기업들은 유용한 데이터 확보에 사활을 걸고 있다. 구글이나 아마존이 거대 정보기술(IT) 기업으로 성장할 수 있었던 밑바탕에는 수많은 데이터 확보가 있었다. 구글은 사용자가 구글 서비스를 이용할 때 수많은 정보를 수집한다.

기업은 흩어져 있는 데이터를 분석·가공해 가치 있는 정보로 추출한 뒤 기업활동에 활용한다. 원유가 정제되면 가스, 플라스틱, 화학제품 등으로 변환돼 다양하게 활용되듯 데이터도 수집, 가공, 분석을 통해 유용한 자산이 된다. 

국내 기업들도 2020년 8월 시행된 '데이터 3법(개인정보보호법·정보통신망법·신용정보법)'을 통해 제품·서비스를 이용하는 고객의 개인정보를 폭넓게 수집해 쓰고 있다. 올해 4월 20일에는 데이터 산업진흥 및 이용촉진에 관한 기본법(데이터산업법)이 시행된다. 

문제는 활용 범위가 공공데이터를 제외한 민간데이터에 국한됐다는 점이다. 

공공데이터란 공공기관이 전자적으로 생성 또는 취득하여 관리하고 있는 모든 데이터베이스(DB), 전자화된 파일을 말한다. 

우리나라는 2013년 10월 시행된 '공공데이터의 제공 및 이용에 관한 법률'에 따라 '공공데이터포털'(data.go.kr)을 운영하고 있다. 

2022년 2월 현재 공공데이터포털에 등록된 공공데이터는 6만8800여건이다. 과거에 비하면 꾸준히 양적으로 확대되고 있지만 그 내용을 들여다보면 아쉬운 부분이 많다. 

동일한 성격의 데이터를 여러 개로 나눠 개수를 채운 경우도 있고, 국민이 필요로 하는 데이터나 대용량 데이터는 개방이 제한되곤 한다. 그러다 보니 공공데이터의 양은 늘었지만 쓸 만한 데이터가 별로 없다는 지적이 나온다. 한국정보화진흥원이 발간한 '2019정보화통계집'을 보면 공공데이터를 활용하지 않는 이유는 '필요한 데이터가 없음'이 53.9%로 가장 많았다.

해외의 사정은 어떨까. 

영국은 공공데이터 개방 정책을 적극적으로 펼쳐온 국가 중 하나다. 

2010년 고든 브라운 총리는 웹과 링크드 데이터의 창시자로 유명한 팀 버너스리를 초빙해 '데이터포털'(data.gov.uk)을 만들었다.

버너스리는 영국의 컴퓨터과학자로 월드와이드웹(www), URL, HTTP 등을 고안하여 웹을 탄생시킨 아버지로 불린다. 그가 없었더라면 구글, 페이스북, 네이버, 카카오의 등장도 늦었을 것이다.  

영국의 데이터포털 사이트는 2018년 3월 '오픈데이터 찾기'(Find Open Data)라는 이름으로 개편됐다. 영국은 자유로운 재이용이 가능한 공공데이터에 '오픈 정부 라이선스'(OGL)를 적용한다. 이 라이선스가 표시된 데이터는 상업적 이용을 포함, 자유롭게 재사용할 수 있다.

미국은 2009년 영국보다 먼저 '데이터 포털사이트'(Data.gov)를 열었다.

이 사이트는 2022년 2월 현재 34만3000건 이상의 데이터 세트를 제공한다. 사이트는 매년 약 2000만 페이지 뷰를 기록한다.

미 정부는 연방보조금 관련 정보를 공개한다. 데이터 개방 범위는 재정 투명성을 위한 예산과 지출, 계약, 공무원 급여 등 광범위하다. 미국은 또 의료 제공자에 대한 보건 의료 빅데이터도 실명으로 개방한다.

미국 연방선거위원회(FEC)는 정치자금의 수입과 지출에 관한 데이터를 즉각 공개한다. 200달러(약 24만원)를 초과하는 기부자는 실명으로 검색할 수 있으며, 공개 기간도 무제한이다.

한국 역시 정치자금을 후원한 사람의 인적사항을 공개하고 있다. 하지만 두 가지 조건이 붙여 '허들'을 매우 높여 놓았다. '정치자금법' 제42조에 따라 선관위에 신청한 사람만 정치자금의 수입·지출 내역을 제공받을 수 있고, 연간 300만원 이하를 기부한 사람의 인적사항과 금액은 공개되지 않는다. 인터넷을 통해 누구나 쉽게 정치자금을 투명하게 확인할 수 있는 미국과는 '하늘과 땅' 차이다. 

◆공공데이터 개방지수 세계 1위…세부 내용선 '딴판'

한국의 공공데이터 개방은 세계 각국과 비교해 어느 정도 수준일까. 

오픈데이터 바로미터(ODB)에 따르면 올해 공공데이터 개방도평가에서 영국과 캐나다가 공동 1위, 호주가 3위, 우리나라와 프랑스가 공동 4위를 차지했다. OECD 회원국을 상대로 한 공공데이터 개방 지수(OUR Data Index)에선 한국이 2019년에 세계 1위를 차지하기도 했다.

하지만 세부적인 내용을 들여다보면 상황은 달라진다.

팀 버너스리의 오픈 데이터 5단계 (자료제공=도리의 디지털라이프)

팀 버너스리가 구분한 오픈데이터의 5단계 중에서 1·2단계에 해당하는 데이터가 많으며, 전국 데이터가 아닌 부분 데이터가 많다. 데이터 내 일부 값이 누락됐거나 오류가 발생하는 경우가 발견되기도 한다. 공공데이터지만 상업적 활용이 불가능한 데이터가 있어 혼동을 야기하기도 한다.

버너스리가 별점으로 구분한 오픈데이터 1단계는 데이터를 웹에 개방형 라이센스를 공개한 상태를 의미하며 2단계는 컴퓨터가 읽을 수 있는 구조화된 형태로 데이터를 제공하는 것을 의미한다. 3단계는 비독점적 포맷, 개방형 포맷으로 데이터를 개방하고 있는 상태이고 4단계는 특정 회사, 특정 소프트웨어 제품을 벗어나 어디서든 열어보고 편집할 수 있는 CSV 파일 형태로 제공하는 것을 말한다. 5단계는 연결 데이터 원칙 준수, 타 데이터 상호운용 가능 수준의 공개를 말한다. 

코로나 19와 관련한 최근의 공공데이터 공개도 미흡하다는 평가가 나왔다. 

미국의 경우 특정 질병 외에도 10여개 카테고리의 데이터를 사용자가 별도의 가공 없이 즉시 활용 가능한 오픈데이터 4단계 포맷으로 제공하고 있다. 하지만 한국의 경우 특정 질병 발생 건수를 오픈 데이터 3단계 형식으로만 다운로드 가능해 개선이 필요한 상황이다. 신신애 한국정보화진흥원 팀장은 "정부 주도의 서비스 한계를 극복하고 신속한 질병 관련 정부-민간 서비스를 개발하기 위해 민간에서 즉시 활용가능한 형태로 다양한 질병 데이터를 개방해야 한다"고 지적했다. 

◆디지털 혁신 통한 글로벌 선도국 도약…획기적 공공데이터 개방 없인 공염불

이재명 더불어민주당 대선 후보와 윤석열 국민의힘 대선 후보 모두 글로벌 선도 국가 도약을 위해 디지털 혁신을 강조하고 있다. 

윤 후보는 특히 디지털 플랫폼 정부를 만들어 국민들이 물리적 세상과 디지털 세상을 자유롭게 넘나들 수 있게 되고, 정부는 국민이 일일이 관청을 방문할 필요가 없는 비대면 원스톱 서비스를 국민에게 제공함으로써, 민첩한 정부, 맞춤화된 국민의 정부 서비스 경험을 제공하겠다고 공약했다. 

디지털 뉴딜 추진계획 (자료제공=과기정통부)

정부도 지난 1월 올해 디지털 뉴딜에 역대 최대인 9조원을 투입하고 법과 제도 정비를 병행해 디지털 전환의 속도를 높일 계획이라고 발표했다. 하지만 획기적인 공공데이터 개방 없이는 공염불이 될 수 있다는 지적이 나온다.

현재 우리나라는 공공데이터 성과 지표에 있어 겉과 속이 매우 다르다. 여기에는 겉치장에 능하고 책임지지 않으려는 공무원 마인드도 한몫하고 있다.

전문가들은 차기 정부가 강력한 의지를 갖고 공공데이터 공개에 나서야 한다고 입을 모은다. 

먼저 공공데이터 개방의 범위를 대폭 확대해야 한다. AI 서비스와 빅데이터 분석에 필요한 비정형 데이터를 전면적으로 개방해야 한다. 각종 정부 보고서와 더불어 사진·이미지·영상 등 민간에서 활용할 수 있는 데이터가 대폭 개방되어야 한다. 또 데이터 생산 단계부터 개방과 품질 기준을 정립하고 공급자 위주의 마인드에서 벗어나야 한다. 

데이터의 개방과 활용을 저해하는 법제도를 개선도 뒤따라야 한다. 민간에서 제기하는 공공데이터 제공 요청의 약 60%는 개별법 또는 정보공개법의 비공개 사유 규정 때문에 거부되고 있다. 데이터 중 일부에 비공개정보가 포함돼 있다고 해 일괄해서 제공 거부하는 관행을 없애야 한다. 국세법·통계법·형사사법절차전자화촉진법 등 개별법 중에서 민간의 요구가 많고 효과가 클 것으로 판단되는 법제도를 우선 개정해야 한다.

문용식 한국지능정보사회진흥원 원장은 "공공데이터 1.0 시대에도 수많은 성과가 있지만 데이터 경제시대의 첫걸음을 겨우 떼었을 뿐"이라며 "공공데이터 2.0 시대로 과감히 전환해 본격적인 데이터 경제시대를 준비해야 할 때"라고 말했다. 

공공데이터 개방은 정보에 대한 시민의 접근성을 높임으로써 경제적, 사회적 가치를 이끌어 낼 수 있다.

공공데이터 개방을 통해 경제적으로는 새로운 일자리를 창출하고, 재화나 서비스를 만들 수 있다. 데이터 구매 비용이나 직접 구축하는 데 드는 인건비 절약 효과도 상당했다. 기업들이 지난 2020년 공공데이터로 창출한 매출은 26.2조 원에 달했다.

안철수 국민의당 대선후보는 지난 21일 대선후보 토론에서 "데이터 산업이라는 것 자체가 공공데이터가 기반이 되어야 한다"라며 "정부에서 전혀 이런 것들을 공개를 하지 않다 보니까 우리나라가 갈수록 뒤쳐지고 있다. 차기 정부의 중요한 국정운영 목표 중 하나가 공공데이터 공개라고 믿는다"라고 강조했다. 

관련기사

저작권자 © 뉴스웍스 무단전재 및 재배포 금지