본문으로 바로가기 주메뉴 바로가기
기본연구
사업보고서 환경 빅데이터 분석 및 서비스 개발(Ⅳ)

제1장 서 론
1. 연구의 필요성 및 목적
2. 연구의 범위
3. 연구 내용 및 방법론
4. 보고서의 구성

제2장 미세먼지 고농도 현상 발생확률 추정
1. 연구 목적
2. 데이터
3. 방법론
4. 결과

제3장 Graph-GRU를 활용한 중장기 초미세먼지 예측: 남한지역을 중심으로
1. 서론
2. 데이터 수집 및 전처리
3. 예측모델 구축 및 평가
4. 소결

제4장 환경 텍스트 감성분류기 구축 및 활용
1. 서론
2. 환경 텍스트 감성분류기 구축
3. 환경감성분류기를 활용성 강화를 위한 웹 앱 구축
4. 소결

제5장 기후변화 이슈 분석 및 질문 중심의 데이터맵 구축
1. 서론
2. 토픽모델링을 활용한 질문의 주제 선정
3. 질문의 식별과 질문의 구조화
4. 질문 중심 데이터맵의 구현
5. 요약 및 결론

제6장 대기오염이 COPD 환자 사망에 미치는 영향
1. 서론
2. 방법론
3. 결과
4. 결론

제7장 딥러닝 기반 태양광발전량 예측
1. 서론
2. 선행연구
3. 영암 태양광발전량 자료 특성
4. 영암에프원 태양광발전량 예측 모형 구축
5. 소결

제8장 요약 및 시사점
1. 연구 결과 요약
2. 정책적 시사점

참고문헌

부 록
Ⅰ. 키워드 검색식

Executive Summary
Ⅰ. 서론: 연구의 필요성 및 목적
o 정책수요 파악, 정책 시의성 평가, 정책 유효성 평가에 사용할 수 있는 ‘환경정책 모니터링 시스템(가칭)’ 구축
ㅇ 환경정책 모니터링 시스템: 기계학습의 장점인 예측의 정교함 및 실시간 데이터 수집-분석-결과 갱신 가능성을 환경정책 연구에 접목
ㅇ 환경오염 통합예측 알고리즘, 실시간 환경 텍스트 분석 알고리즘, 질문중심 데이터베이스 3개 분석도구로 구성
- 환경오염 통합예측: 다양한 환경오염물질 오염도 예측 주기적 반복
- 실시간 환경 텍스트 분석: 환경 텍스트 정보추출 및 감성분석 주기적 반복
- 질문중심 데이터베이스: 주요 환경이슈 목록 - 이슈 관련 데이터 분석을 연계하여 주기적으로 결과 실시간 업데이트
ㅇ 정책수요 파악: 환경오염 예측 알고리즘의 예측치, 환경정책 수요자 텍스트 분석 결과, 환경이슈기반 데이터 분석 결과를 사용하여 환경정책 개입이 필요한 부문을 파악
ㅇ 정책 시의성 평가: 민간 텍스트 분석 결과와 환경정책 생산자 텍스트 분석 결과를 비교하여 정책 공급자의 대응이 정책 수요자의 관심과 조응하는지 여부를 진단
ㅇ 정책 유효성 평가: 환경오염 예측 알고리즘의 정책 시행 전 예측치와 시행 후 실측치, 정책시행 전후 질문중심 데이터맵 분석 결과, 정책시행 전후 민간 텍스트 감성분류 결과 비교

o 2020년 연구목표: ‘환경정책 모니터링 시스템’ 의 복잡성 및 인과관계 분석기능 부족을 해소하는 방향으로 연구내용을 확장
ㅇ 1기 (2017~2019년) 연구의 성과를 계승하면서 기계학습 방법론의 약점인 모형의 복잡성 및 인과관계 분석기능 부족을 해소하는 방향으로 연구 확장
- 1기 ‘기계학습 방법론’ 적용 연구 → 2기 ‘대용량 데이터’를 이용한 환경정책 연구
- 방법론: 1기 ‘기계학습’ → 2기 기계학습 + 전통적 통계학 기법(Frequentist/ Bayesian)
o 모형의 단순화: 개별 변인이 분석 결과에 미치는 영향력 분석 기능 강화
o 중장기 예측이 가능한 연구, 인과분석이 가능한 연구 추구

o 연구내용: 환경정책 모니터링 시스템 구성요소 연구 4건, 개별연구 2건 수행
ㅇ 환경정책 모니터링 구성요소: 기존 구성요소의 방법론 및 분석 대상 확대
- 환경오염 예측 (2건): ‘미세먼지 고농도 현상 발생확률 추정’/‘Graph-GRU 모형을 이용한 초미세먼지 오염도 추정 및 예측’
- 환경 텍스트 분석: ‘환경 텍스트 감성 분석기 구축 및 활용’
- 질문 중심 데이터베이스: ‘기후변화 이슈 분석 및 질문중심의 데이터맵 도출’
ㅇ 개별연구: 수용체 연구 1건, 신재생에너지 연구 1건 추진
- 수용체 연구: ‘대기오염이 COPD 환자 사망에 미치는 영향’
- 신재생 에너지 연구: ‘태양광 발전 발전량 예측 알고리즘 구축’

Ⅱ. 미세먼지 고농도 현상 발생확률 추정
o 서울지역 25개 측정소 초미세먼지 오염도가 ‘매우 나쁨’(76 이상)이 될 경우를 예측하는 Qunatile Regression 기반 통계모형 개발
ㅇ Qunatile Regression 모형을 Extreme value가 많은 자료에 적합하게 조정
-Extreme Conditional Qunatile Regression Model + Variable Selection (LASSO)
저자발간물