내일배움캠프_데이터분석_2기/NOT_STUDY

[데이터 분석 프로젝트] 호텔 운영관리 대시보드 구축

단ee 2024. 7. 18. 22:20
  • 프로젝트 명 : 호텔 운영 관리 대시보드 구축
  • 프로젝트 기간 : 2024년 07월 03일(수) ~ 07월 12일(금)
  • 팀 구성 : 4인
  • 역할 : 팀장, 프로젝트 발표 및 프로젝트 기획

1. 프로젝트 개요

  • 프로젝트 목표
    • 2017년 상반기(1월 ~6월) 호텔 운영 관련 정보를 대시보드로 시각화하여, 상반기 운영 현황에 관한 인사이트 제공
  • 프로젝트 핵심 내용
    • 상반기 결산 보고 회의에 제시될 자료로, 호텔 경영 최고 관리자, 각 파트 별 관리자를 대상으로 하는 대시보드
    • 서비스 부문 별 책임자가 상반기를 리뷰하며 인사이트를 도출할 수 있도록 데이터 시각화
  • cf. 주요 호텔 KPI 지표

 

2. EDA 및 전처리

  • 사용 데이터 및 전처리
    • https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand/data
    • 총 119,390 개의 행과 32개의 컬럼으로 구성됨
    • 포르투갈에 위치한 City Hotel과 Resort Hotel의 고객 예약 데이터 
      • 예약 일자가 연/월/일 모두 다른 자료형으로 서로 다른 컬럼에 분리되어 arrival_date라는 컬럼 생성
      • 평일 숙박과 주말 숙박의 adr(평균 객실 요금)을 비교했을 때 큰 차이가 없었고, 예약 건당 전체 예약 일수를 확인하기 위해 주중 숙박 일수와 주말 숙박 일수를 더해 staying nights라는 컬럼 생성
  • 결측치 및 이상치 처리
    • 결측치 존재 컬럼 중, 분석에 사용하지 않은 컬럼은 별도 처리 없이 제외함
      • agent와 company 컬럼은 direct한 예약 건 외에 존재하는, 예약자 ID에 대한 컬럼으로, 상호 배타적임
    • 사용한 컬럼 중 결측치가 있는 country, children 컬럼은 결측치를 제외하고 분석
    • 당일 숙박-당일 퇴실한 예약 건이 약 600건 존재했고, 이들은 객실이 해당 일자에 점유된 상태로 해석하여 이상치로 제외하지 않음
  • EDA를 통한 호텔의 현황 분석
    1. 계절적 특성 : 2, 3분기는 매출이 높은 편임에 비해, 1, 4분기에는 매출이 하락하는 경향
    2. 호텔의 예약 취소 관련 : 보증금 유형 중 “환불 불가”의 경우가 있어, 이 경우 예약을 취소하더라도 매출이 발생
    3. 고객 특성 : 호텔 숙박 고객은 단기 체류 목적이 많고, 외국인 비율이 높음
    4. 가격 : 주중과 주말 숙박 요금 차이가 크지 않고, 무료 숙박 투숙객이 있음

3. 대시보드 구성

  • 상반기 호텔의 운영 상황을 확인할 수 있는 매출 관련 대시보드와 상반기 예약 고객의 특성을 분석한 대시보드 2개로 구성
  • 또한 합계/리조트/시티 호텔의 결과를 개별로 확인할 수 있도록 상단 필터 설정

 

4. 결론

  • 대시보드를 통해 상반기 매출(revenue)는 증가했으나, 평균 객실 단가(adr)역시 계속 상승하였고, 이에 반해 객실 점유율은 전년 대비 감소했음을 확인
    • 낮은 객실 점유율에 따라, 호텔 운영으로 발생하는 비용 대비 매출액이 적을 것으로 추측. 리스본 지역의 동년 호텔 평균 점유율은 78%이므로, 경쟁 호텔 대비 적은 이윤을 남기고 있는 것이 아닌지 점검 필요
    • 하락한 객실 점유율에 대한 원인 분석 필요. 현재 데이터의 결과로만 보았을 때, 높아진 평균 객실 단가가 그 원인으로 보임 ⇒ 객실 가격 정책에 대해 재고 필요
  • 상반기 외국인 투숙객 비율이 높아, 하반기 직원 서비스에 있어 외국인 응대 교육을 강화하거나, 인력 충원 필요

 

 

  • 프로젝트 한계 및 추가 분석 방향
    • 호텔에 대한 추가적인 데이터가 필요. 상반기 발생 비용 및 별도 부대 시설을 통한 추가 수익구조가 있는지, 전체 객실 수는 몇 개인지 등.
      • 해당 정보가 없어 주요 지표의 계산에 임의의 가설 값을 사용하여 정확하게 산출할 수 없었음
    • 예약 별 고유의 ID 값이 필요
      • 예약자 ID, 예약번호 등의 데이터를 추가로 수집해야 상세한 고객 분석이 가능
                        •