Skip to content

jmpark0118/BIGDATA-COMPETITION_SQUIRREL-BUS

Repository files navigation

대회 소개

  • 목적

    • 정부혁신의 일환으로 통계빅데이터센터 자료 분석 기회를 제공하여 데이터 기반의 의사결정 문화 확산통계빅데이터센터 이용 활성화
  • 주제: 데이터로 통하는 세상!

    • 공공데이터와 민간데이터를 융·복합하여 사회·경제적 현상 분석 및 정책 의사결정 모델 발굴, 창업 아이디어 등 제안
  • 지원자격

    • 개인 또는 팀 (3명 이하)의 형태로 누구나 참여 가능
    • 외국인의 경우 개인 참가는 어려우며, 한국인을 포함한 팀으로 참가 가능
  • 대회기간

    • 2019.06.03(월) ~ 2019.08.02(금)
  • 활용데이터: 통계빅데이터센터 제공자료, 공공·민간데이터

    • 타출처의 데이터와 연계 분석 가능
    • 통계빅데이터센터 제공자료
      • 행정통계자료 (통계등록부(10종), 행정통계 (8종)), 민간자료 (SKT 빅데이터)

(장려) 서울특별시 버스 노선 혼잡도 예측을 통한 다람쥐 버스 신규 노선 제안 👏

고명지, 박정민, 유채연 (이화여대 대학원 통계학과)
  • 분석 취지

    • 버스 정류소 및 노선별 이용객 수를 예측하고 버스 내 혼잡도를 계산하여 신규 노선을 제안하고자 한다.
  • 활용 데이터

    • 통계청 통계빅데이터센터에서 제공하는 민간데이터 중 기초정보 인구집중유발시설 자료와 이용자 보유자료를 사용하였다.
  • 분석 방법

    • XGBoost 모형을 이용하여 버스 정류장별 순 승차인원을 예측하였고, 다람쥐버스가 운행 중인 지역의 군집분석을 진행하였다.
  • 분석 결과

    • 다양한 변수를 이용하여 모델링을 하여 최적의 모형을 찾고, 이를 기반으로 기존 버스 노선들의 정류장별 순 승차인원(승차-하차)을 예측할 수 있었다. 모델리을 통해 예측한 순 승차인원이 많은 버스 노선을 찾아, 이를 기반으로 다람쥐버스의 신규 노선을 제안할 수 있었다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages