내일배움캠프_데이터분석_2기/NOT_STUDY

[데이터 분석 프로젝트] E-Commerce 매출 활성화를 위한 전략 방안 도출

단ee 2024. 9. 3. 09:22
  • 프로젝트 명 : E-Commerce 매출 활성화를 위한 전략 방안 도출
  • 프로젝트 기간 : 2024년 07월 22일 ~ 08월 22일(5주)
  • 팀 구성 : 4인
  • 역할 : 프로젝트 기획 및 발표

 

 

 

1. 프로젝트 개요


  • 프로젝트 목표
    • 매출 하락세인 전자상거래 플랫폼에 대해 데이터 분석을 통한 문제 규명 및 매출 활성화를 위한 전략 제시
  • 프로젝트 핵심 내용
    • 매출 정체에 영향을 주고 있는 문제를 확인하고, 규명된 문제를 해결할 수 있는 가설을 수립하고 검증한다
    • 매출 정체 해소를 위한 방법으로 고객 별 추천 상품 메세지 발송 실험을 설계하여 제안한다

 

 

2. EDA 및 전처리


 

 

  • 결측치 및 이상치 처리
    • 데이터 수집이 불충분한 것으로 판단되는 기간을 제외하고 2017년 1월 ~ 2018년 8월 기간의 데이터를 분석 
    • 결측치 존재 컬럼 중, 텍스트 단순 누락의 경우 추가하였고, 그 외에는 결측치 제외하고 분석 진행
    • "배송 완료" 를 매출 발생의 기준으로 정하고, 그 외의 값은 제외하고 분석 진행
    • 배송 소요 일수가 음수인 경우, 주문 완료 이전에 배송 준비가 완료된 건은 이상치로 판정하여 삭제

 

 

 

 

 

  • 데이터 EDA 및 문제 정의
    1. 2017년 11월 최대 매출액 달성 후 매출 성장 폭이 둔화됨
    2. 2018년 2분기는 직전 분기 매출액 대비 0.0% 성장, 3분기는 -40% 성장
    3. 고객 당 객단가는 시간에 따른 큰 변화 추세가 없으나, 2018년 1분기 기점 구매 고객 수 감소
    4. 구매 유형 별 고객 수의 변화가 나타남 : 재구매 고객은 전체 구매 고객 수의 2.1%에 불과
      1. 재구매 고객 : 고객 별 최초 구매일로부터 1일(24시간) 이후 주문 완료한 고객으로 정의
      2. 일회성 고객 : 재구매를 하지 않은 고객으로 정의
    5. 전체 매출 중 96%가 일회성 고객에 의해 발생
    6. 따라서, 일회성 고객 매출 의존도가 매우 높고, 일회성 고객 수 감소로 인해 매출 하락 발생
    7. 보다 효율적인 비용으로 매출을 확보하기 위해, 일회성 고객을 재구매 고객으로 전환하는 전략 선택 

 

 

3. 가설 검증 및 분석 결론


가설 검증 기준의 수립

  1. 각 비교군에 대하여 전체 기간 평균 재구매율(2.1%)보다 높을 경우 재구매율에 유의미한 영향을 주는 요인으로 정의
  2. 두 비교군의 재구매율 %p 차이가 1%p 이상일 경우 가설 채택

 

 

 

  • 총 4개의 가설 설정  → 3개 가설 기각, 1개 가설 최종 채택
    • 재구매 고객은 동일한 카테고리의 상품을 다시 구입하는 경향을 보였으며(전체 재구매 건수 2,452건 중 99.8%), 하위 카테고리 역시 동일한 경우(99.9%)가 많았음
  • 정의한 문제와 가설 검증 결과를 통해, 재구매율 확대를 위한 '고객 별 맞춤평 상품 추천 메세지 발송' 실험을 계획

 

4. 전략 방안 : 실험 설계


  • 실험 설계를 위한 추가 분석 진행
    • 전체 상품 카테고리 중, 상위 3개 카테고리만 구매 고객 비중이 20% 이상으로 높음
    • 카테고리 별 재구매율 차이로 인해 1~3순위 변동이 있으나, 재구매 역시 동일한 3개 카테고리에 집중
    • 매출 활성화 전략의 빠른 실험 수행을 위해, 재구매율이 평균보다 높으며 구매 고객 비중이 20% 이상이며, 평균 재구매율 이상인 카테고리 선정
    • 발송 대상 고객 집단은 약 5,800명으로, 전체 신규 일회성 고객 중 48.3%에 해당

 

 

 

  • 실험 설계를 통한 액션 플랜 제시 및, 실험 평가 지표 계획

 

 

5. 프로젝트 한계, 피드백 및 향후 분석 계획


  • 프로젝트 한계 및 피드백
    • 데이터 한계로 인한 추가 분석(고객 관련, 상품 관련, 배송 관련 등)이 제한적
    • 18년 3분기 전체가 반영되지 않은 기간(2017년 1월 ~ 2018년 8월)으로, 시각화 시 분기별 집계가 아닌 월별 집계 필요
    • 결측치, 이상치로 제외한 데이터 중 중요한 데이터가 누락되었을 가능성 존재

 

  • 향후 추가 분석 계획
    • 데이터 전처리 방법을 달리하여, 문제 재정의
    • 보다 고객 특성을 파악하기 위한 군집 분석 진행