끄적끄적

CH 2. 기초 프로젝트 - 최종 정리 본문

[스파르타]내일배움캠프 데이터 분석 트랙/Project

CH 2. 기초 프로젝트 - 최종 정리

kminx 2025. 6. 23. 15:02

🛵 프로젝트 개요

이번 프로젝트는 인도 배달 서비스 플랫폼에서 수집된 약 4만 건의 배달 데이터를 분석하여, 배달의 효율성 향상서비스 품질 개선을 도모하기 위한 인사이트를 도출한 작업이다.

분석의 핵심은 크게 두 가지이다.

  1. 시간대별 배달 효율
  2. 경로 내 회전 횟수(Turn Count)를 통한 도로 복잡도 분석

주요 변수 도출

분석을 위해 다음과 같은 주요 지표들을 위치 좌표 및 도로망 데이터를 기반으로 정량화했다. 

  • 직선 거리: 출발지~도착지 간 유클리디안 거리 (geopy)
  • 도로 기반 최적 거리 & 소요 시간: 실제 도로망 기준으로 계산 (MapBox)
  • Turn Count: 경로 내 회전(turn) 횟수 → 도로 복잡도 지표  (MapBox)
  • 평균 속도: 거리 대비 소요 시간 기반
  • 도시명: reverse geocoding을 통해 추출

주요 데이터 전처리

정확한 분석을 위해 다음과 같은 전처리 과정을 수행했다.

  • 문자열 "NaN " -> NaN 변환 후 처리
  • Age, Ratings 결측치 및 이상치 처리 → 동일 ID 기준 평균값으로 대체
  • 필요없는 문자열, 공백 제거
  • 날짜 데이터 전처리 -> 시간 데이터를 날짜+시간 데이터
  • 인도 국경 기준으로 해안, 강 등에 위치한 비정상 배달 데이터 제거
  • 이상치 제거

🕒 인사이트 1: 시간대별 배달 전략

배달 시간대를 3구간으로 나누어 분석한 결과, 각 시간대마다 배달 성향과 효율에 큰 차이가 있음을 발견했다.

시간대 특징 전략
오전 (08:00~10:00) 빠른 배달 비율 80~95% 모닝 프로모션: 아침 간편식 강조
오후 (12:00~16:00) 주문량 낮고 안정적 디저트 타임딜: 스낵·음료 할인 유도
저녁 (17:00~23:00) 지연율, 주문량 가장 높음 묶음배달 혜택: 피크 타임 효율 개선

 

 

기대 효과

  • 시간대 맞춤 마케팅 → 재주문 증가
  • 효율적인 배차 운영 → 운영 비용 절감
  • 배달 품질 향상 → 고객 만족도 증대

🔁 인사이트 2: Turn Count로 본 도로 복잡도

분석 배경

  • Turn Count는 회전이 잦은 복잡한 경로를 의미
  • 배달 시간과는 직접 상관은 없지만
    인지 부하, 피로 누적, 사고 위험 증가와 연관 가능

분석 결과

  • Indore, Surat, Bangalore
    • 주문량이 많은 동시에
    • Turn Count가 높은 복잡한 도로망을 보유한 대표 도시

인지 부하 관점 요약

  • 회전이 많을수록 → 방향 판단, 신호 확인, 조작 증가
  • 반복적 의사결정 → 인지 자원 소모, 운전 피로 누적
  • 결과적으로 → 오배송·사고 위험 ↑

 

기대 효과

  • 고복잡 경로 → 숙련 라이더 우선 배차
  • 인센티브 제공 → 피로 분산
  • 도로 기반 배차 최적화 → 서비스 품질 향상

최종 정리

분석 접근 주요 인사이트 기대 효과
시간대별 분석 배달 효율은 시간대에 따라 뚜렷한 차이 시간대별 맞춤 전략 → 운영 효율 + 수익 향상
Turn Count 분석 회전 많은 도로 = 복잡도·인지 부하 증가 숙련자 배치 및 위험 도로 대응 → 피로도·사고 감소

마무리

이번 분석은 단순히 “배달 시간을 줄이자”는 것이 아니다.
데이터를 통해 고객 만족도, 라이더 피로도, 경로 효율성까지 아우르는 배달 시스템을 고민한 실험이었다.



2025.06.13 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 23일차 - 기초 프로젝트 데이터 전처리 (1)

 

23일차 - 기초 프로젝트 데이터 전처리 (1)

사용하는 데이터더보기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobject Delivery_person_IDDelivery Person 고유 ID ob

kminx.tistory.com

2025.06.18 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 26일차 - 기초 프로젝트 데이터 전처리 (2)

 

26일차 - 기초 프로젝트 데이터 전처리 (2)

사용하는 데이터더보기닫기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobjectDelivery_person_IDDelivery Person 고유

kminx.tistory.com

2025.06.17 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 25일차 - 기초 프로젝트 데이터 분석 (1)

 

25일차 - 기초 프로젝트 데이터 분석 (1)

사용하는 데이터더보기닫기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobjectDelivery_person_IDDelivery Person 고유

kminx.tistory.com

2025.06.19 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 27일차 - 기초 프로젝트 데이터 분석 (2)

 

27일차 - 기초 프로젝트 데이터 분석 (2)

우리는 배달 애플리케이션에 데이터 분석가이다.회사측에서 이득을 볼 수 있는 방법을 찾아보자.서비스 개선 방향 탐색고객이 배달 앱을 더 잘 활용하게 하려면 어떻게 해야 할까?우리는 시간

kminx.tistory.com