끄적끄적
CH 2. 기초 프로젝트 - 최종 정리 본문
🛵 프로젝트 개요
이번 프로젝트는 인도 배달 서비스 플랫폼에서 수집된 약 4만 건의 배달 데이터를 분석하여, 배달의 효율성 향상과 서비스 품질 개선을 도모하기 위한 인사이트를 도출한 작업이다.
분석의 핵심은 크게 두 가지이다.
- 시간대별 배달 효율
- 경로 내 회전 횟수(Turn Count)를 통한 도로 복잡도 분석
주요 변수 도출
분석을 위해 다음과 같은 주요 지표들을 위치 좌표 및 도로망 데이터를 기반으로 정량화했다.
- 직선 거리: 출발지~도착지 간 유클리디안 거리 (geopy)
- 도로 기반 최적 거리 & 소요 시간: 실제 도로망 기준으로 계산 (MapBox)
- Turn Count: 경로 내 회전(turn) 횟수 → 도로 복잡도 지표 (MapBox)
- 평균 속도: 거리 대비 소요 시간 기반
- 도시명: reverse geocoding을 통해 추출
주요 데이터 전처리
정확한 분석을 위해 다음과 같은 전처리 과정을 수행했다.
- 문자열 "NaN " -> NaN 변환 후 처리
- Age, Ratings 결측치 및 이상치 처리 → 동일 ID 기준 평균값으로 대체
- 필요없는 문자열, 공백 제거
- 날짜 데이터 전처리 -> 시간 데이터를 날짜+시간 데이터
- 인도 국경 기준으로 해안, 강 등에 위치한 비정상 배달 데이터 제거
- 이상치 제거
🕒 인사이트 1: 시간대별 배달 전략
배달 시간대를 3구간으로 나누어 분석한 결과, 각 시간대마다 배달 성향과 효율에 큰 차이가 있음을 발견했다.
| 시간대 | 특징 | 전략 |
| 오전 (08:00~10:00) | 빠른 배달 비율 80~95% | 모닝 프로모션: 아침 간편식 강조 |
| 오후 (12:00~16:00) | 주문량 낮고 안정적 | 디저트 타임딜: 스낵·음료 할인 유도 |
| 저녁 (17:00~23:00) | 지연율, 주문량 가장 높음 | 묶음배달 혜택: 피크 타임 효율 개선 |
기대 효과
- 시간대 맞춤 마케팅 → 재주문 증가
- 효율적인 배차 운영 → 운영 비용 절감
- 배달 품질 향상 → 고객 만족도 증대
🔁 인사이트 2: Turn Count로 본 도로 복잡도
분석 배경
- Turn Count는 회전이 잦은 복잡한 경로를 의미
- 배달 시간과는 직접 상관은 없지만
→ 인지 부하, 피로 누적, 사고 위험 증가와 연관 가능
분석 결과
- Indore, Surat, Bangalore는
- 주문량이 많은 동시에
- Turn Count가 높은 복잡한 도로망을 보유한 대표 도시
인지 부하 관점 요약
- 회전이 많을수록 → 방향 판단, 신호 확인, 조작 증가
- 반복적 의사결정 → 인지 자원 소모, 운전 피로 누적
- 결과적으로 → 오배송·사고 위험 ↑
기대 효과
- 고복잡 경로 → 숙련 라이더 우선 배차
- 인센티브 제공 → 피로 분산
- 도로 기반 배차 최적화 → 서비스 품질 향상
최종 정리
| 분석 접근 | 주요 인사이트 | 기대 효과 |
| 시간대별 분석 | 배달 효율은 시간대에 따라 뚜렷한 차이 | 시간대별 맞춤 전략 → 운영 효율 + 수익 향상 |
| Turn Count 분석 | 회전 많은 도로 = 복잡도·인지 부하 증가 | 숙련자 배치 및 위험 도로 대응 → 피로도·사고 감소 |
마무리
이번 분석은 단순히 “배달 시간을 줄이자”는 것이 아니다.
데이터를 통해 고객 만족도, 라이더 피로도, 경로 효율성까지 아우르는 배달 시스템을 고민한 실험이었다.
2025.06.13 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 23일차 - 기초 프로젝트 데이터 전처리 (1)
23일차 - 기초 프로젝트 데이터 전처리 (1)
사용하는 데이터더보기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobject Delivery_person_IDDelivery Person 고유 ID ob
kminx.tistory.com
2025.06.18 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 26일차 - 기초 프로젝트 데이터 전처리 (2)
26일차 - 기초 프로젝트 데이터 전처리 (2)
사용하는 데이터더보기닫기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobjectDelivery_person_IDDelivery Person 고유
kminx.tistory.com
2025.06.17 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 25일차 - 기초 프로젝트 데이터 분석 (1)
25일차 - 기초 프로젝트 데이터 분석 (1)
사용하는 데이터더보기닫기데이터 출처: https://www.kaggle.com/datasets/gauravmalik26/food-delivery-dataset/data?select=train.csv 테이블 설명: 컬럼명설명데이터 타입ID주문 건 IDobjectDelivery_person_IDDelivery Person 고유
kminx.tistory.com
2025.06.19 - [[스파르타]내일배움캠프 데이터 분석 트랙] - 27일차 - 기초 프로젝트 데이터 분석 (2)
27일차 - 기초 프로젝트 데이터 분석 (2)
우리는 배달 애플리케이션에 데이터 분석가이다.회사측에서 이득을 볼 수 있는 방법을 찾아보자.서비스 개선 방향 탐색고객이 배달 앱을 더 잘 활용하게 하려면 어떻게 해야 할까?우리는 시간
kminx.tistory.com
'[스파르타]내일배움캠프 데이터 분석 트랙 > Project' 카테고리의 다른 글
| CH 4. 실전 프로젝트 - 데이터 전처리 (1) | 2025.08.18 |
|---|---|
| CH 3. 심화 프로젝트 - 데이터전처리 (4) | 2025.07.17 |
| CH 2. 기초 프로젝트 - 데이터 분석 (2) (2) | 2025.06.19 |
| CH 2. 기초 프로젝트 - 데이터 전처리 (2) (5) | 2025.06.18 |
| CH 2. 기초 프로젝트 - 데이터 분석 (1) (3) | 2025.06.17 |