내일배움캠프_데이터분석_2기/TIL

[TIL] camp_day70_240724

단ee 2024. 7. 25. 21:04

최종 프로젝트 사흘차. 프로젝트 기획 피드백을 받고, 이번 프로젝트 때 수행할 머신러닝 방법 중 클러스터링을 각자 복습했다.

팀 프로젝트


  • 전체적인 그림은 대충 그려진 것 같은데, 실제 데이터셋 EDA 했을 때 원하는 방향으로 결과가 나와줄지가 관건이다.
  • 이전 프로젝트보다 프로젝트 기획에 할애할 시간이 많아져서 다 같이 문제 정의를 하는 시간을 가져보았다.
    1. 우리가 정의할 문제는 해결하고자 하는, 부정적인 영향을 미치는 사건
    2. 정의한 문제를 해결하기 위한 여러가지 방법들 중, 데이터를 통해 증명하고 싶은 주장이 프로젝트에서 설정하는 가설

학습 내용


  1. 클러스터링 라이브 세션 복습
    1. 클러스터링 = 군집 분석(비지도학습)
    2. 클러스터링 분석 프로세스
      1. 데이터 기간 선정
      2. 이상치 기준 선정 및 제외
      3. 표준화
      4. 차원 축소(PCA)
      5. K값(군집의 개수), 초기 컬럼(피처) 선정
      6. K-means Clustering
      7. 군집 분포 확인
      8. 2~7번을 반복하여 최적의 결과 도출
      9. 모델링
      10. 데이터 적재 및 자동화 설정
      11. 인사이트 도출

'내일배움캠프_데이터분석_2기 > TIL' 카테고리의 다른 글

[TIL] camp_day72_240726  (0) 2024.07.27
[TIL] camp_day71_240725  (0) 2024.07.26
[TIL] camp_day69_240723  (0) 2024.07.23
[TIL] camp_day68_240722  (0) 2024.07.23
[TIL] camp_day66_240718  (0) 2024.07.18