home > 정책과 담론 > 경제산업
공공데이터 개방, 쌓아둔 데이터부터 제대로 관리하고 효율적으로 활용하자
데이터베이스로 관리하고 검색, 활용을 용이하기 위해 어떻게 공공데이터를 설계하여야 할 것인가에 대한 고민이 부족하다. 그 대표적인 사례가 공공데이터 제공형식의 불일치에서 오는 불편함이다. 개방하였다 하더라고 바로 활용하기 어렵기 때문이다.
이경민(kyungmin.lee@bluespiral.co.kr)
Ph D, ㈜블루스파이럴 사업팀장 (Co-work with 남효정 / ㈜블루스파이럴 연구원)
  this article :

우리나라에 인터넷이 대중적으로 보급되기 시작한 90년대, PC통신을 주름잡으며 98년부터 검색서비스를 시작했던 ‘천리안’은 알고 있었을까? 시공간의 제약 없이 사람이 가진 어떤 물체도 작은 컴퓨터가 되고, 사람들은 본인도 모르게 이런 기기들을 통해 수많은 데이터를 남기고, 컴퓨터는 다시 그 데이터를 저장하고, 사람들은 이것을 분석하여 미래를 예측하는 사회.

정확한 데이터 분석이야말로 앉아서 천리 밖을 보게 해주는 ‘천리안’이 아닐까?

 

설 연휴의 마지막 날이었던 지난 22일은 국제 오픈 데이터의 날(International Open Data Day)이었다.

많은 국가들이 데이터를 통한 행정혁신, 시민참여형 정책운영, 시민맞춤형 정책수립으로 새로운 형태의 거버넌스 기반의 국가운영을 시도하고 있다. 또한 정부가 보유하고 있는 공공데이터를 일반인과 개발자, 그리고 관련 산업 종사자에게 접근과 분석이 용이한 형식으로 개방하고, 연관 산업 발굴에 적극적으로 나서고 있다. 데이터라는 말이 이렇게 많이 쓰이고 들렸던 적이 있었을까 할만큼 공공데이터와 빅데이터에 대한 관심이 최고조에 달하고 있다.

 

 

 한국의 공공데이터 개방

 

우리나라의 공공데이터 개방은 ‘정부3.0’ 추진과 함께 시작 되었다. 행정영역에서 빅데이터 혹은 공공데이터의 활용은 정책과 행정서비스를 받는 수혜자에 대한 정확한 이해를 바탕으로 필요한 정책을 수립하고 추진하기 위해 사용되고 있다. 국제 네트워트인 Opengovernment.org는 데이터를 개방하여 행정에 활용하는 여러 사례들을 공유하며, 국가별 현황을 살펴보고, 각각의 사례를 벤치마킹 할 수 있는 그룹이다. 우리정부도 이 단체의 회원국으로 활동하고 있다.

참여정부에서부터 시작된 행정혁신과 정부혁신, 그리고 현 정부에서 추진 중인 정부3.0과 공공데이터 개방사업은 정부의 정책에 국민들이 참여할 수 있는 열린 정부를 위한 노력의 과정이다. 국가가 가지고 있는 다양한 데이터들이 개발자와 사업가들의 아이디어와 기술을 거쳐 더 나은 행정서비스, 새로운 비즈니스 모델로 재탄생 될 것으로 본다.

 

 

 사회를 바라보는 통찰, 위기를 돌파하는 전략으로서의 데이터

 

2000년대 초 미국을 중심으로 사회과학자들은 다시 데이터에 주목하기 시작하였다. 아마 사회과학영역에서 본격적으로 빅데이터에 관심을 두게 된 결정적인 계기는 2008년 미국 대선이었을 것이다. 당시 민주당과 공화당 모두 데이터 기반의 선거운동과 전략을 구사했는데, 유권자 데이터 분석을 통해 개개인의 심리까지 읽어내는 정교한 전략으로 무장한 오바마 캠프가 승리하였다. 이 사건을 통해 그동안 데이터와 거리가 멀던 정치영역에서도 데이터와 그 분석에 대해 관심을 두게 되었다. 2015년 5월 총리선거를 앞두고 있는 영국 역시 49% vs 51% 싸움의 최후 전략을 데이터 분석과 활용이라고 보고, 미국 대선승리의 노하우를 전달받기 위해 오랜 시간 학습하고 체화하려 노력하고 있다.

숫자를 통한 설득, 경험에 의해 그리고 감정 호소에 의해 세워지던 선거 전략이 데이터를 이용하며 과학적인 정치전략으로 변화하고 있다.

 

 

 구슬이 서 말이라도 꿰어야 보배. 쌓아둔 데이터부터 제대로 관리하고 효율적으로 활용하자

 

공공데이터의 기본은 통계청에 있다. 즉, 중앙정부와 지방자치단체, 또는 공공기관에서 실시하는 다양한 사회조사(인구센서스, 사업체 기초통계조사, 사회조사 등)를 통해 수집되는 통계자료는 우리가 가장 쉽게 접근할 수 있는 공공데이터이다. 한 단계 더 들어가면 중앙 및 지방정부에서 정책수행과정에서 쌓아가는 많은 데이터들, 정부산하기관, 연구기관들이 사업수행과 연구과제를 통해 생산하는 다양한 형식의 데이터들 역시 공공데이터이자 빅데이터이다.

하지만 데이터베이스로 관리하고 검색, 활용을 용이하기 위해 어떻게 공공데이터를 설계하여야 할 것인가에 대한 고민은 부족하다. 그 대표적인 사례가 공공데이터 제공형식의 불일치에서 오는 불편함이다. 특히 일부 기관에서 제공하는 공공데이터의 경우, 원 데이터(Raw Data)가 아닌 그래프와 표로 가공된 형식이거나, 문서파일에 표로 첨부된 형식, 그것도 아니면 PDF와 같이 이미지로 저장되어 텍스트 인식이 어려운 경우도 많다. 이런 형식의 데이터들은 개방하였다 하더라고 바로 활용하기 어렵다. 일일이 수작업을 거쳐 다시 DB화해야 하기 때문에 전혀 효율적이지 못하다.

정부는 공공데이터 개방 이전에 시민들에게 제공할 데이터들의 형식이라도 표준화하여 분석과 활용이 용이하도록 사전작업을 하여야한다. 모든 데이터가 보물은 아니다.

 

2015년 2월 21-22일 양일간 영국 정부는 공공 분야의 데이터가 개발자들과 기업가들에게 더욱 널리 활용되어 행정 영역뿐만 아니라 사업 분야에서도 활용될 수 있도록 제1회 오픈 데이터 캠프를 개최하였다. 데이터를 활용하여 보다 질 좋은 행정서비스를 제공하고, 데이터에 대한 접근방법과 그 정보가 부족하여 데이터에 굶주려있던 기업들에게 데이터 기반의 산업분야를 개척하고 성장할 수 있도록 하는 것이다. 이 캠프에서 특히 주목 받았던 기업들은 정부에서 개방한 공공데이터를 다양한 목적에 적합하도록 지도화하여 서비스하거나, 다양한 소스의 공공 데이터와 지리적 정보가 담긴 데이터를 결합하여 지리적 특성에 따라 어떤 차이를 보이는지 분석, 설명하는 서비스를 하는 곳들이었다.

 

2015년 한국의 공공데이터 영역은 어떤 변화가 일어날까? 데이터 간의 멋진 결합을 통해 시민들이 정치와 행정에 참여할 수 있는 통로가 개척되거나, 기업을 포함한 민간영역이 필요로 하는 정책을 마련할 준비가 되어있는가? 모두에게 물어본다.

키워드 / 태그 : 공공데이터, 빅데이터, 오바마

float_section