최종 프로젝트 사흘차. 프로젝트 기획 피드백을 받고, 이번 프로젝트 때 수행할 머신러닝 방법 중 클러스터링을 각자 복습했다.
팀 프로젝트
- 전체적인 그림은 대충 그려진 것 같은데, 실제 데이터셋 EDA 했을 때 원하는 방향으로 결과가 나와줄지가 관건이다.
- 이전 프로젝트보다 프로젝트 기획에 할애할 시간이 많아져서 다 같이 문제 정의를 하는 시간을 가져보았다.
- 우리가 정의할 문제는 해결하고자 하는, 부정적인 영향을 미치는 사건
- 정의한 문제를 해결하기 위한 여러가지 방법들 중, 데이터를 통해 증명하고 싶은 주장이 프로젝트에서 설정하는 가설
학습 내용
- 클러스터링 라이브 세션 복습
- 클러스터링 = 군집 분석(비지도학습)
- 클러스터링 분석 프로세스
- 데이터 기간 선정
- 이상치 기준 선정 및 제외
- 표준화
- 차원 축소(PCA)
- K값(군집의 개수), 초기 컬럼(피처) 선정
- K-means Clustering
- 군집 분포 확인
- 2~7번을 반복하여 최적의 결과 도출
- 모델링
- 데이터 적재 및 자동화 설정
- 인사이트 도출
'내일배움캠프_데이터분석_2기 > TIL' 카테고리의 다른 글
[TIL] camp_day72_240726 (0) | 2024.07.27 |
---|---|
[TIL] camp_day71_240725 (0) | 2024.07.26 |
[TIL] camp_day69_240723 (0) | 2024.07.23 |
[TIL] camp_day68_240722 (0) | 2024.07.23 |
[TIL] camp_day66_240718 (0) | 2024.07.18 |