분류 전체보기 85

[TIL] camp_day63_240715

프로젝트가 끝난 여파로... 아무 것도 안 하고 놀면서 하루를 보내버렸다...밀린 TIL과 WIL을 정리해보려 했는데, 그마저도 안 해서 내일 학습을 열심히 하면서(!) 기록물도 채울 생각이다.학습 내용매번 헷갈리는 sort 와 sorted(Python)sort(list) : list 원본을 수정하지 않고, 정렬해서 print만 해준다. .sorted() : 해당 리스트의 값 자체를 정렬한다. 풀이한 문제_프로그래머스_명예의 전당(1)상위 k 번째 중, 매일 가장 낮은 점수를 리스트에 담아 출력해야 하는 문제.빈 리스트 두 개를 만들어, 하나에는 새로 추가되는 점수를 이어 붙이면서 리스트 정렬 후 상위 k 번째만큼 자른 다음 최소값을 구해 answer라는 빈 리스트에 값을 계속 붙여나가는 구조로 코드를 ..

[WIL] 2024_w28_주간 회고_내일배움캠프_데이터분석2기_13주

이번 주의 목표와 달성프로젝트 무사히 잘 끝내기 → [완료]프로젝트 회고 하기 & 튜터 피드백 정리하기 → [완료]이번 주의 학습 키워드Tableau대시보드 시각 이번 주 한 눈에 보기이번주의 KPT_개인Keep- 적절한 프로젝트 목적과 목표를 설정하고, 팀 프로젝트 진행이 원활하게 진행되도록 관리하는 일 -프로젝트 내용을 정리하여 팀에 공유하고, 매일 스크럼 시간을 통해 일일 목표를 설정하고 회고하는 것 - 지난 번 프로젝트보다 파이썬 실력이 늘었다. 지금처럼 학습 병행하기.Problem- 프로젝트 기간 중 시간 관리가 원활하지 않다. 이로 인해 매일 TIL 작성을 놓치고, 프로젝트가 끝난 이후 여유 시간이 생겼을 때에서야 일일 회고를 진행하여 누락되는 부분이 생긴다.- 프로젝트 종료 후, 진행한 프로..

[TIL] camp_day62_240712

프로젝트 발표일. 첫 번째 발표 그룹에서 맨 마지막 순서로 발표하게 되어 좀 떨리는 상태로 다른 팀의 발표를 들어야 해서 아쉬웠지만, 그래도 발표는 무사히 마무리 지었다.팀 프로젝트우리 팀 프로젝트 관련 피드백 요약프로젝트 배경을 5W1H에 따라 상세히 설정한 점은 좋았으나, 발표 뒷부분 결론에서 대시보드 뷰어에게 연결되는 부분이 명확하게 이어지지 않았다.분석에 사용한 파생변수가 다소 많다 : 계산된 필드(파생변수)를 많이 사용할 경우, 각 파생변수가 목표와 어떻게 연결되는지 구체화해야 한다.태블로의 범례 기능을 활용하여, 대시보드에 표현한 약어에 대한 설명을 추가하면 더 좋을 것 같다.결론 부분을 통해 추론한 바로는, 프로젝트를 진행하며 상반기 운영 내용에 대한 가설을 여럿 세운 것 같은데, 발표 초반..

[TIL] camp_day61_240711

드디어 프로젝트 끝!! 제출할 자료들 다 냈고 내일 발표만 남았다!!! 팀 프로젝트 - 간단한 회고와 정리이번 프로젝트에서는 그 동안 학습한 태블로 관련 스킬을 적용해 최종 결과물로 대시보드를 만들어야 했다.우리 팀은 예시 주제가 아닌, 자유 주제를 선택해 도메인 선정 부터 데이터셋을 찾고, 프로젝트 진행 방향을 기획하는 완전 기초 단계부터 시작해야 하는 상황이었다. 우여곡절 끝에 선정한 주제는 "관광업/호텔" 이었고, 수집한 데이터를 통해 호텔 운영 관리라는 인사이트를 가지고 프로젝트를 시작했다.팀원 중 호텔업계 경력이 있는 분이 계셔서 돌아가는 구조는 대강 알 수 있었지만, 개인적으로는 관련 업계 지식이 거의 전무한 상태였다. 해봐야 고객으로서 국내/외 호텔을 이용해 본 경험 정도?그래도 전체적인 수..

[TIL] camp_day57_240705

12주차 마지막 날. 프로젝트 기간이 약 1/3 지났고, 프로젝트 기획서 작성을 완료했다.학습 내용pandas DataFrame의 행 반복 처리하기데이터 탐색 중, 특정 지표값 계산에 데이터프레임의 각 행마다 특정 컬럼의 값에 따라 조건부로 수식을 적용해야 일이 생겼다.투숙 완료한 고객으로 인해 발생한 실제 매출 또는 취소된 예약이지만 환불 불가하여 매출로 집계된 경우에만 매출로 계산하고, 그 외에는 0으로 출력하여 실제 발생된 매출을 새로운 컬럼으로 만들어야 했다. 요약한 조건절은 아래와 같다. 1. 예약 상태가 '체크 아웃' 일 경우: '평균 객실 단가' * '숙박일수' 2. 취소 여부가 '취소' & 보증금이 '환불 불가' 일 경우: '평균 객실 단가' * '숙박일수' 3. 그..

[TIL] camp_day56_240704

부트캠프 12주차 네 번째 날. 프로젝트 이틀차가 끝났다.팀 프로젝트주제를 변경하기로 결정하고 어제 저녁 이야기가 나왔던 도메인 중에서, 괜찮은 데이터셋을 찾아 주제 변경을 확정지었다. 데이터 구조 뜯어보면서 팀 단위에서 논의했던 내용이 아깝기는 했지만, 프로젝트 결과까지 생각해보면 과감히 폐기한 것이 좋은 선택이 될 것 같다.캐글에서 찾은 데이터인데, 데이터 자체가 논문에서 발췌된 것이라 원문 페이퍼에 자세한 컬럼 정의서가 기재되어 있었다. 영문이고 너무 자세한 설명에, 컬럼 수가 32개에 달하다보니 컬럼 정의서는 조금 나중에 번역하고 정리할 생각이었다.하지만 각각의 컬럼의 특징에 대한 이해 없이 먼저 EDA를 진행하니 중간중간 이해할 수 없는 카테고리나 결과가 나와서 일단 다른 팀원들은 데..

[TIL] camp_day54_240703

실전 프로젝트 첫째 날! 자유 주제를 해보자는 의견은 맞았는데, 구체적인 주제 선정은 완료하지 못했다. 팀 프로젝트이번 프로젝트는 실전 프로젝트로, 약 일주일 동안 학습했던 태블로를 활용해 대시보드를 만드는 것이 목표이다.주제는 마케팅 / 이커머스 / 영화 추천의 총 세 가지 카테고리가 제시되었고, 자유 주제를 선택하여 원하는 대시보드를 만들 수도 있었다.우리 조는 주어진 주제보다는 자유 주제를 하자는 쪽으로 의견이 모였고, 대시보드에 어울릴 주제를 각자 탐색해보았다.태블로를 이용하여 데이터를 대시보드로 구현하는 프로젝트에 전염병이나 범죄율 같은 주제를 많이 활용했다는 팀원의 의견에 따라, 전염병 중에서도 모두가 경험한 '코로나'에 관련된 대시보드를 구현해보기로 했다.처음 '코로나 대시보도' 라는 키워드..

[TIL] camp_day52_240701

본캠프 12주차 시작. 오늘은 태블로 과제 풀이와 함께 오랜만에 코딩테스트를 열심히 풀었다.학습 내용숫자를 출력하는 함수들(SQL) : 참고정수로 나타내기SQLABS(숫자) # 절대값 CEIL(숫자) # 가장 가까운 정수 출력, 소숫점 이하 올림 FLOOR(숫자) # 가장 가까운 정수 출력, 소숫점 이하 내림자릿수를 기준으로 반올림 또는 내림하기SQL ROUND(숫자, 자릿수) # 자릿수 바로 전에서 반올림 TRUNCATE(숫자, 자릿수) # 자릿수 바로 전에서 버림몰랐던 함수들SQL GREATEST(num1, num2, num3...) # 숫자들 중에 가장 큰 수만 출력한다 LEAST(num1, num2, num3...) # 숫자들 중에 가장 작은 수만..

[TIL] camp_day51_240627

오늘은... 공부를 안 하고 하루를 그냥 보냈다. 코딩테스트만 몇 문제 풀었는데, 아직 쉬운 문제 구간이라 쉽게 풀렸다.SQL 정규표현식 문제정규표현식 복습!복잡한 검색을 할 때 패턴을 구체화 할 수 있는 강력한 기능단순히 Like ‘%word%’ 문을 쓰는 것을 넘어서, 첫 번째 글자로는 어떤 패턴의 문자가 오고, 중간에 어떤 구조가 반복되고, 맨 마지막에는 어떤 문자로 끝나야 하고, 이렇게 자세한 조건을 걸어서 필터링 할 수 있다.기본적으로 REGEXP 와 RLIKE 는 주어진 문자열이 정규 표현식과 일치하면 True(1)를 반환한다. SQL #1 pattern 일 경우 WHERE column_1 REGEXP 'abc' -- column_1의 행 중에서 'abc'가 포함된 경우 Tru..

[TIL] camp_day50_240626

벌써 부트캠프 11주차도 절반이나 지났다. 오늘부터는 새로운 조에서 태블로를 통한 대시보드 시각화를 학습한다.학습 내용BI 와 태블로BI란?Business Intelligence의 약자로, 조직에서의 데이터 기반 의사 결정을 지원하는 기술, 프로세스, 툴의 집합비즈니스 분석, 데이터 마이닝, 데이터 시각화 등의 데이터 도구BI 도구를 활용해 SQL, Python 보다 데이터를 손쉽게 분석하고 시각화 할 수 있다.Tableau활용하기 좋은 여러 장점을 가지고 있어 널리 쓰이는 BI 툴다양한 형식의 파일(csv, xlsx 등)을 대시보드로 쉽게 만들 수 있고, 활발한 커뮤니티를 통해 여러 자료를 얻기 수월함데이터 용량이 크거나 대시보드의 양이 많아지면 로딩 속도가 느려지고, 가격이 비싸다는 단점도 존재기타 ..