- 1주차 다섯번째 날. 팀 프로젝트 발표를 마쳤고, 온보딩 주차가 끝났다. 또 다음주부터 진행될 SQL 세션 맛보기 강의 시간이 있었다.
팀프로젝트
* 무사히 발표를 마쳤다. 다행이 우리 조가 앞쪽이라 발표를 끝내고 가벼운 마음으로 다른 조들의 발표를 들을 수 있어서 너무 좋았다.
* 다른 조의 발표에 비해 분석 스킬적인 부분에서는 조금 부족했지만, 그래도 문제 선정과 해결을 위한 발표 흐름 과정은 잘 잡았다.
만약에 이 프로젝트를 추가로 개선시킨다면
* 분석하고자 하는 데이터에 대한 소개, 용어 정의가 더 있으면 좋을 것 같고, 데이터 전처리 과정이 부족했다.
타겟으로 하는 범위를 설정하고 결과값에 영향을 줄 수 있는 범위 밖의 데이터를 제거했다던가,
목표 키워드만 추출해서 새로운 컬럼을 만들었다던가, 또는 구간별 점수를 부여하여 가중치를 다르게 주었다는 부분이 인상적이었다.
* 가설 검증에 대한 통계 지표를 넣어야겠다.
* 시간이 모자라서 다 못했던 부분이었는데, 가설에 대한 결과가 교차되는 지점을 추가적으로 더 분석하면 좋았을 것 같다.
내가 맡았던 품목별 부분과 다른 분이 맡았던 지역까지는 연결시킬 수 있었는데,
다른 가설들과도 겹치는 부분이 분명 있을 거 같은데 전부 다 확인하기에는 시간이 너무 짧았다.
변수 간 상관관계를 더 알아보면 유의미한 결과가 도출될 것 같다!
* 팀 프로젝트는 무사히 끝났지만, 발표에 대한 뿌듯함보다는 통계 공부를 정말 열심히 해야겠다는 다짐만 굳건히 남았다.
이제 심심하면 통계 이론책 읽고 정리해야겠다.
학습 내용
* 탐색적 데이터 분석(EDA, Exploratory Data Analysis)
* 데이터를 처음 접하는 단계에서 수행하는 과정
* 데이터의 패턴, 관계, 이상치 등을 발견하고 이해하기 위해 시각화와 통계적 기법을 사용하는 것
* 기본적으로 데이터가 가진 정보를 파악해 특성을 파악하고, 후속 분석을 위한 가설 설정에 도움을 준다.
* '데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 '탐색과 이해'를 기본으로 가져야 한다'.
> 벨연구소의 수학자 존 튜키가 개발한 데이터 분석 과정에 대한 개념
(나만 몰랐나... 튜터님이 계속 EDA 라고 하셔서 뭔지 몰라서 찾아봤다)
고찰 & 기타
* 오늘 프로젝트 발표를 들으면서 새삼 느꼈는데,
비전공자로서 내가 캠프 스케줄과 다른 수강생들의 수준을 따라가려면 정말 많은 노력을 기울여야겠단 생각이 들었다. 열공!
* 지금은 SQL에 집중해야겠지만, 파이썬 공부는 SQL의 배는 더 해야겠다.
* 사전캠프 기간에 가벼운 마음으로 짧게 공부하고 봤던 빅분기 필기를 붙을 거 같다...! 세상에 이게 되네??? 왜 되지??
근데 딱 총점 60점을 받아서 하나라도 답 정정되면 불합격이다ㅋㅋㅋ 다음주가 될 때까지 그냥 얌전히 기다려봐야 한다...
* 본캠프 기간에는 자격증 공부할 시간이 따로 없을 거라고 하셨는데 진짜 그럴줄이야. ADsP는 언제 공부하지?
참고 : EDA 아티클1_EDA의 개념과 데이터 분석 잘 하는 법