본문으로 바로가기 주메뉴 바로가기
국토환경관리
환경 빅데이터 분석 및 서비스 개발
이 표에서는 연구기간,과제구분,연구분야,연구책임자,참여연구원,저자발간물등의 내용을 제공합니다.
연구기간 2017-01-01 ~ 2017-12-31 과제구분 일반사업
연구분야 연구책임자 강성원
참여연구원 강성원 , 김진형 , 강선아 , 김도연 , 장기복 , 이동현 , 한국진 , 정은혜 , 공현숙 , 진대용 , 홍한움
내용 □ 본 사업은 빅데이터 분석기법을 활용한 환경연구 및 원내외 서비스 개발을 추진하며, 그 과정에서 집적된 자료와 분석기법을 오픈 소스 인프라로 제공하는 사업

○ 본 사업은 ‘환경 빅데이터 연구’, ‘환경 빅데이터 인프라’, ‘원내외 빅데이터 서비스’ 3개 세부 사업으로 구성
- 환경 빅데이터 연구: 빅데이터 분석 기법을 환경연구에 적용하는 연구
- 환경 빅데이터 인프라: 연구 과정에서 축적된 자료 및 알고리듬을 오픈 소스로 제공하고 이를 기초로 환경 빅데이터 분석 플랫폼 구축을 도모
- 원내외 빅데이터 서비스: 빅데이터 분석 기법을 활용하여 원내 서비스를 제공하고 및 공공 서비스를 설계

○ 3년 단위로 연구범위를 설정하고 각 부분별 연차계획을 수립하여 진행하며, 각 단계별 평가를 실시하고, 평가결과를 반영하여 다음 단계를 수정·보완하여 추진
- 1단계(2017-19) : 환경 빅데이터 연구 및 원내 서비스를 시작하고 연구 과정에서 축적한 자료 및 분석 알고리듬을 오픈 소스로 공개
- 2단계(2020-22) : 환경 빅데이터 연구 투입자료 및 분석 알고리듬을 활용하여 환경 빅데이터 분석 플랫폼을 설계하고 빅데이터 활용 공공서비스 설계
- 3단계(2023-25) : 환경 빅데이터 분석 플랫폼의 주요 기능 지능화를 시도하고 공공환경서비스 시범사업을 실시

□ 연구 수요 파악, 데이터 수집 및 가공, 데이터 분석 과정에서 빅데이터 연구 기법을 활용하는 ‘환경 빅데이터 연구’를 시행

○ 빅데이터 정보 수집 기법을 활용하여 환경연구 및 환경정책 수요자들의 요구를 파악하여 연구주제를 선정
- KEI 기(旣) 제공 환경정보서비스(환경DB, 기관보고서, 전자도서관) 로그 분석 및 이용자 패턴분석을 주기적으로 시행하여 환경정보 이용자의 요구를 파악
- 정보미디어 분석, 설문조사, 심층면담 등으로 다각적 자료를 수집하고 자연언어분석(Natural Language Processing) 기법을 적용하여 연구수요 정밀예측
· SNS 서비스, 포털, 각종 디지털 미디어에 빅데이터 자료 수집-가공 방법론(Data Mining)을 적용하여 환경정보 수요를 실시간으로 파악
· 환경이슈에 대한 남자·여자, 연령대별, 직종별, 관련·비관련 등 세분화 된 이용자 요구파악을 위한 설문조사를 병행
· 자연언어분석 등 언어자료 패턴 분석에 특화된 빅데이터 연구 기법을 활용하여 환경연구 수요를 도출

○ 자료 수집 및 전처리 과정에 특화된 빅데이터 자료처리 기법을 활용하여 분석에 필요한 투입 자료를 구축
- 인터넷 기반 정형화 자료 및 텍스트 기반 비정형화 자료를 검색-수집하고 분석에 활용할 수 있도록 전처리하여 분석 투입 자료로 활용하고 자료구축 경험 축적
· 인터넷 기반 자료 수집 (Web crawling, Web Scraping), 언어자료 전처리(Text Mining), 수리 자료 전처리(Imputation, dimension reduction) 등 분석 이전 자료 처리 목적으로 발달된 빅데이터 자료처리 기법을 활용
- 환경영향평가서, 연구보고서 등 비정형 원내 자료를 전산화하고, 이를 분석 가능한 형태로 전처리

○ 빅데이터 분석기법을 활용하여 소규모 지역사회 및 개인별 맞춤형 수요를 반영하는 환경위험 전망, 환경정책 설계 및 환경정책 평가 연구를 시행
- [전망] 환경오염원 데이터, 오염도 결정요인 데이터, 건강정보 데이터에 빅데이터 분석기법을 적용하여 시·공간 해상도가 높은 환경위험 전망치를 제공
- [정책설계] 빅데이터 전망기능을 활용하여 지역별, 사회경제적 인구집단 별 환경정책 우선순위를 파악하고 이를 재원배분에 반영하는 효율적 환경정책 설계연구 시행
- [정책평가] 기(旣) 시행 정책수행 지표 및 환경위험 지표에 빅데이터 분석기법을 적용하여 정책시행과 환경위험 개선 간의 관계를 소규모 지역사회 단위로 파악하는 정밀한 환경정책 평가 연구를 시행

○ [2기 이후] 자료 축적 및 분석기법 기계학습이 임계점을 넘으면 발신주기를 단축하고 시의성 중심으로 발신 방향을 전환
- 빅데이터 분석기법은 범용성이 있어서 관련 자료가 충분히 축적되면 다방면의 연구에서 활용 가능한 이점을 활용
· 모형 구축 및 자료 수집이 문제에 따라 달라지는 기존의 연구방식보다는 분석 알고리듬의 범용성이 있는 빅데이터 분석이 발신주기 단축에 적합
- 초기 자료 축적 및 분석기법 기계학습(Machine Learning)에 소요되는 시간의 임계점이 지나면 시의성 있는 주제에 대해 신속한 발신이 가능
- 시의성 있는 주제에 대한 신속한 발신으로 민간의 호기심을 충족하고 정책 개발에 필요한 1차 추정치(First Approximation)를 제공

□ ‘환경 빅데이터 연구’ 과정에서 축적된 자료 및 개발된 알고리듬을 오픈 소스로 공개하여 빅데이터 분석기법을 활용하는 환경연구 및 정책개발의 인프라로 제공

○ 환경 빅데이터 연구 투입자료(input data) 및 자료수집 방법론을 축적하고, 이를 기존 환경관련 자료와 연계하여 환경정보 포털을 구축
- 연구자가 필요한 정보를 일괄 수집하는 정보 포털로 활용하도록 유도
· 이미 공개된 정보를 수요자가 one-stop shopping이 가능하도록 연계
· 환경영향평가, 환경경제지출계정, 기후변화시나리오 및 적응정보, 환경공간정보 등 KEI가 보유하고 있거나 구축중인 자료를 자료DB 연계
· 정보화 및 전산화가 되지 않았거나 전산화를 수행하기 어려운 데이터나 지식을 환경정보 네트워크에 연계하는 방안을 마련
- 빅데이터 자료수집 방법론을 사용하여 자료원의 변화를 실시간으로 반영
· 자동화된 인터넷 기반 자료 수집 (Web crawling, Web Scraping)을 주기적으로 반복하여 자료의 변화를 파악하고 이를 환경포털에 반영

○ 환경 빅데이터 연구 활용 알고리듬을 축적하고, 이를 기반으로 중장기적으로 빅데이터 분석 핵심기능(자료수집·전처리·분석)을 자동화
- 수요 파악: 웹기반 자료수집 알고리듬을 이용하여 환경관련 정보를 수집하는 과정을 자동화하고, 이를 주기적으로 시행하도록 설정
- 자료 전처리: 환경관련 자료원의 변화를 실시간으로 감지하여 자료를 update하고 이를 자주 활용되는 분석에 적합한 형태로 가공하는 작업을 자동화
- 자료 분석: 개발된 알고리듬에 새로운 자료를 지속적으로 기계학습(Machine Learning)시키고 적용 범위를 확대하여 분석기능 및 분석범위를 확대
· 알고리듬의 범용성이 큰 빅데이터 분석기법의 장점을 활용

○ 자료 및 알고리듬을 공개하여 연구원 내·외부 활용 경험을 확산하고, 이용자의 자발적 의견제시를 반영하여 환경연구의 신뢰도 제고 및 소비자 편이성 증진 도모
- 클라우드 서비스를 활용하여 환경 빅데이터 연구에 활용된 자료 및 분석기법을 공개하여 필요에 따라 이용하도록 제공
- 환경 빅데이터 연구 과정 및 방법론을 민간에서 reverse engineering이 가능한 수준으로 상세히 공개하고, 기술적 문제점에 대한 체계적인 대응을 제공하여 적극적 사용자층을 형성
· 사용자들이 알고리듬을 이용하면서 발생하는 기술적 문제에 대한 의견교환이 가능한 온라인 게시판을 운용하고 문제 해소 방법을 제시
· 각종 연구 및 민간사업 서비스 창출을 위해 데이터 및 알고리듬을 사용하고자 하는 적극적 사용자층을 형성
- 다양한 층위의 환경 빅데이터 연구자료 및 알고리듬 사용자 community를 구축하고 사용자들의 경험 및 의견을 축적하여 분석기법을 심화
· 유관주제 연구자 간 실시간 의견 교환이 가능한 on-line community 구축을 시도하여 전문적인 의견 및 연구 경험 공유를 모색
※ 유관주제 연구자: 빅데이터 분석의 ICT 정책 활용방안 연구‘(정보통신정책연구원: 주재욱)’,‘교통부문 빅데이터 공유플랫폼 구축 및 공동활용방안’(교통연구원: 송태진), ‘기계학습 기반 사회보장 빅데이터 분석 및 예측모형 연구’(보건사회연구원, 오미애), ‘여성가족 빅데이터의 활용을 통한 정책 개선과 발굴’(여성정책연구원, 문유경), ‘현장수요기반 빅데이터 항만보안 및 안전시스템 구축방안 연구’(해양수산개발원, 전형모), ‘빅데이터 기반 국가전략 수립 활성화 방안’(행정연구원, 윤광석),‘빅데이터를 이용한 대기오염의 건강영향 평가 및 피해비용 추정’(환경정책평가연구원, 안소은), ‘빅데이터를 활용한 증거기반 건축 및 미래정책 개발체계 연구’(건축도시공간연구소, 조영진) 연구책임자를 포함하여 빅데이터 연구에 전문적인 관심과 경험이 있는 연구자

· 사용자들의 자발적인 데이터 공유?분석 사례학습을 통하여 데이터의 신뢰성을 검증하고 활용성을 확대
· 사용빈도 및 물리적 입?출력(I/O) 등 데이터의 활용도를 추적하여 이용자의 요구를 파악하고 이를 반영하여 데이터 및 알고리듬의 활용성 개선
· 이용자의 활용 소감 및 자발적 의견을 반영하여 알고리듬을 이용자의 요구에 적합하도록 지속적으로 개선

○ [2기 이후] 환경정보 수요예측, 1차 환경정보의 고급화, 환경정보 분석체계 다변화 등을 자동화하는 자가 학습이 가능한 지능화된 분석 플랫폼으로 발전을 시도
- 환경 빅데이터 연구 경험을 바탕으로 `정보 수집- 전처리- 분석- 발신‘의 정보분석 과정을 자동화 할 수 있는 ’환경 빅데이터 분석 플랫폼‘을 설계
· 사용자 community의 이용 패턴과 의견을 반영하여 수요자의 요구에 적합한 분석 플랫폼으로 구성
- 설계단계 이후 각 부문의 기본적인 기능만을 갖춘 분석 플랫폼을 구축하고, 조기에 오픈 소스 형태로 공개
- 구축된 분석 플랫폼을 이용한 환경빅데이터 연구 결과를 지속적으로 발신하여 사용방식을 전파하고, 오픈 소스 사용자 community의 활용 경험을 축적
- 축적된 대내외 연구경험을 활용하여 다양한 상황에 대해 최적의 분석방법을 선택하고 경험식에 반영하여 이용자에게 추천하는 기능을 획득

□ 환경 빅데이터 연구 과정에서 생성되는 빅데이터 분석 알고리듬을 활용하여 원내 경영 서비스 및 공공 서비스를 개발

○ 원내 정보시스템(전자결재)에 축적된 경영 정보에 빅데이터 분석기법을 적용하여 인사, 재무, 정보 관리 등 연구원 경영 전반에 필요한 정보를 추출
- 인사기록 및 성과지표를 분석하여 인적자본 축적에 필요한 정보를 추출하고 이를 활용하여 원내 교육 및 육성 프로그램을 구축
- 과거 사업의 예산 편성 및 집행 실적 자료를 분석하여 효율적 예산편성 및 집행에 필요한 요소를 파악
- 원내 정보시스템 이용 패턴을 분석하여 사용자들의 요구를 파악하고 이를 시스템 운영 및 개선 방안에 반영

○ 빅데이터 분석 알고리듬을 이용한 연구정보 대외 제공 정보시스템(웹페이지, 전자도서관) 콘텐츠를 개발하고, 이용자의 요구를 파악하여 시스템을 개선
- 연구 주제의 변화 추이, 보고서 간 네트워크, 보고서 수요 패턴 등을 분석한 결과를 정보시스템에 등재하여 사용자의 편이를 제고
- 이용자 접속 로그 및 의견 기록을 분석하여 사용자의 수요를 파악하고, 이를 전자정보 시스템 운용 및 개선에 반영

○ [2기 이후] 과거 연구기획서, 연구보고서, 보고서 평가 및 감수 관련 자료를 집적하고 분석 알고리듬을 적용하여 과제 기획 및 평가 준비에 필요한 정보를 제공
- 기획 단계에서 선행 연구 내용 및 관련 주제 연구 네트워크 정보를 제공하여 잠재적 공동연구 대상을 파악 및 연구주제의 창의성 제고에 기여
- 과거 유사 연구의 평가 실적과 연구 내용간의 패턴을 파악하여 연구자가 평가 대비에 활용할 수 있도록 제공

○ [3기 이후] 축적된 자료 및 알고리듬을 이용하는 공공 환경정보서비스를 개발하고 이를 무상으로 제공하는 시범사업을 실시

- 다양한 온-오프라인 정보수집을 통해서 ‘KEI가 제공하는 공공환경서비스’에 대한 수요를 파악하고, 이들 중 민간이 제공하기 어려운 서비스를 제공
· 연구소 웹사이트 이용 정보, 미디어 및 SNS 정보 등 온라인으로 수집할 수 있는 정보를 빅데이터 수집-분석 기법을 적용하여 수요를 도출
· 설문조사, 심층 인터뷰 등 온라인으로 수집하기 어려운 개인 심층 선호 자료를 수집하여 수요 파악에 반영
· 오픈 소스로 공개된 환경 빅데이터 연구 자료 및 알고리듬 사용 community의 이용 패턴 및 사용 의견을 분석하여 수요 파악에 반영
· 반영된 수요 중 자료에 대한 접근성, 발신 규제 등으로 민간에서 제공하기 어려운 서비스를 우선적으로 제공
- 상세하게 구분된 수요자의 요구를 반영하고, KEI의 고유자료 활용을 극대화할 수 있는 공공 환경 서비스를 개발하고 시범사업을 실시
· 환경오염예보 및 개인 특성 반영 건강위해요소 예보 시스템을 개발
※ 대기, 수질, 폐기물, 소음, 화학물질 등 환경오염원 데이터와 배출원 외 오염도 결정요인 데이터를 융합하여 시·공간 해상도가 높은 환경오염 예보시스템 개발
※ 환경오염원 데이터와 건강정보 데이터를 융합하여 지역 및 개인 맞춤형 건강위해요소 예보시스템을 구축
· 환경영향평가정보와 공간정보를 융합하여 환경영향평가 준비 시스템을 개발
※ 20여년 이상 축적된 환경영향평가서(평가서 및 평가과정 모두 포함) 자료를 전산화하고 이를 공간환경정보 및 사회경제 정보와 연계
※ 연계된 정보에 빅데이터 분석기법을 적용하여 환경영향평가 결과 예측, 민원 갈등 예측 등 환경영향평가 준비에 필요한 정보를 제공
· 스마트폰 위치정보와 환경질 정보를 연계하여 맞춤형 환경정보를 실시간으로 전달하는 on-the-spot 서비스를 제공
※ 환경위해지역 실시간 파악 서비스: 천식환자를 위한 환경위해 알람 서비스, 백화점·쇼핑센터 등 대형건물 내 '위해지역' 실시간 파악 서비스
※ 소비자 맞춤형 환경정보전달 서비스: 소비자의 모바일 위치정보와 소비자의 특성을 결합하여 소비자의 흥미 및 필요에 적합한 환경정보를 추출하여 스마트폰에 전달
저자발간물