-
목적
- 정부혁신의 일환으로 통계빅데이터센터 자료 분석 기회를 제공하여 데이터 기반의 의사결정 문화 확산 및 통계빅데이터센터 이용 활성화
-
주제: 데이터로 통하는 세상!
- 공공데이터와 민간데이터를 융·복합하여 사회·경제적 현상 분석 및 정책 의사결정 모델 발굴, 창업 아이디어 등 제안
-
지원자격
- 개인 또는 팀 (3명 이하)의 형태로 누구나 참여 가능
- 외국인의 경우 개인 참가는 어려우며, 한국인을 포함한 팀으로 참가 가능
-
대회기간
- 2019.06.03(월) ~ 2019.08.02(금)
-
활용데이터: 통계빅데이터센터 제공자료, 공공·민간데이터
- 타출처의 데이터와 연계 분석 가능
- 통계빅데이터센터 제공자료
- 행정통계자료 (통계등록부(10종), 행정통계 (8종)), 민간자료 (SKT 빅데이터)
-
분석 취지
- 버스 정류소 및 노선별 이용객 수를 예측하고 버스 내 혼잡도를 계산하여 신규 노선을 제안하고자 한다.
-
활용 데이터
- 통계청 통계빅데이터센터에서 제공하는 민간데이터 중 기초정보 인구집중유발시설 자료와 이용자 보유자료를 사용하였다.
-
분석 방법
- XGBoost 모형을 이용하여 버스 정류장별 순 승차인원을 예측하였고, 다람쥐버스가 운행 중인 지역의 군집분석을 진행하였다.
-
분석 결과
- 다양한 변수를 이용하여 모델링을 하여 최적의 모형을 찾고, 이를 기반으로 기존 버스 노선들의 정류장별 순 승차인원(승차-하차)을 예측할 수 있었다. 모델리을 통해 예측한 순 승차인원이 많은 버스 노선을 찾아, 이를 기반으로 다람쥐버스의 신규 노선을 제안할 수 있었다.