취업준비/kt 에이블 스쿨

1차 미프 후기

syquji 2025. 11. 19. 11:49

주제: 지자체의 효율적인 공공 주차시설 확보를 위한 데이터 분석

목표: 2개 이상의 데이터셋의 상관 관계 분석

 

문제 정의: 불법 주정차

필요 데이터: 공영주차장 안내 정보, 주정차 위반 단속 현황 (CSV파일)

 

이상적 수행 과정:

1. 데이터 전처리 (결측치, 데이터 불일치, 이상치 처리)

2. 데이터 분석 (가설 설정, EDA, 상관관계 시각화, 확증 편향 최소화)

3. 인사이트 도출 (문제 제기 - 원인 분석 - 데이터 기반의 근거 제시 - 해결책 제안)

 

실제 수행 과정:

1. 데이터 전처리

2개의 데이터셋을 통합하고 컬럼을 통일함

분석의 기준이 되는 컬럼을 선택함

데이터 분석을 위해 필요한 새로운 컬럼을 추출함 ("단속 시간")

 

2. 데이터 분석

불법 주정차가 많은 지역을 시각화함

불법 주정차가 많은 시간을 시각화함 (전처리에서 새로 추출한 컬럼을 분석)

공급과 수요 데이터의 상관관계를 분석 (공급은 주차장 데이터셋, 수요는 단속 데이터셋 참고)

 

3. 인사이트 도출

공급-수요 격차가 큰 지역에 어떤 방안을 도입해야 불법 주정차 문제가 해결이 될까?

생활인구, 근처 사업체 현황 등 분석 데이터를 추가해 2차 분석을 시행함

공영주차장 신설 외에도 시간대별 단속 증가, 단기 주차 허용 등의 다양한 해결책을 도출할 수 있었음

 

소감

데이터 전처리가 제일 중요하다

분석은 사실상 시각화 작업

어차피 중요한 해결책 제안은 사람이 한다