분류 전체보기 91

[TIL] camp_day57_240705

12주차 마지막 날. 프로젝트 기간이 약 1/3 지났고, 프로젝트 기획서 작성을 완료했다.학습 내용pandas DataFrame의 행 반복 처리하기데이터 탐색 중, 특정 지표값 계산에 데이터프레임의 각 행마다 특정 컬럼의 값에 따라 조건부로 수식을 적용해야 일이 생겼다.투숙 완료한 고객으로 인해 발생한 실제 매출 또는 취소된 예약이지만 환불 불가하여 매출로 집계된 경우에만 매출로 계산하고, 그 외에는 0으로 출력하여 실제 발생된 매출을 새로운 컬럼으로 만들어야 했다. 요약한 조건절은 아래와 같다. 1. 예약 상태가 '체크 아웃' 일 경우: '평균 객실 단가' * '숙박일수' 2. 취소 여부가 '취소' & 보증금이 '환불 불가' 일 경우: '평균 객실 단가' * '숙박일수' 3. 그..

[TIL] camp_day56_240704

부트캠프 12주차 네 번째 날. 프로젝트 이틀차가 끝났다.팀 프로젝트주제를 변경하기로 결정하고 어제 저녁 이야기가 나왔던 도메인 중에서, 괜찮은 데이터셋을 찾아 주제 변경을 확정지었다. 데이터 구조 뜯어보면서 팀 단위에서 논의했던 내용이 아깝기는 했지만, 프로젝트 결과까지 생각해보면 과감히 폐기한 것이 좋은 선택이 될 것 같다.캐글에서 찾은 데이터인데, 데이터 자체가 논문에서 발췌된 것이라 원문 페이퍼에 자세한 컬럼 정의서가 기재되어 있었다. 영문이고 너무 자세한 설명에, 컬럼 수가 32개에 달하다보니 컬럼 정의서는 조금 나중에 번역하고 정리할 생각이었다.하지만 각각의 컬럼의 특징에 대한 이해 없이 먼저 EDA를 진행하니 중간중간 이해할 수 없는 카테고리나 결과가 나와서 일단 다른 팀원들은 데..

[TIL] camp_day54_240703

실전 프로젝트 첫째 날! 자유 주제를 해보자는 의견은 맞았는데, 구체적인 주제 선정은 완료하지 못했다. 팀 프로젝트이번 프로젝트는 실전 프로젝트로, 약 일주일 동안 학습했던 태블로를 활용해 대시보드를 만드는 것이 목표이다.주제는 마케팅 / 이커머스 / 영화 추천의 총 세 가지 카테고리가 제시되었고, 자유 주제를 선택하여 원하는 대시보드를 만들 수도 있었다.우리 조는 주어진 주제보다는 자유 주제를 하자는 쪽으로 의견이 모였고, 대시보드에 어울릴 주제를 각자 탐색해보았다.태블로를 이용하여 데이터를 대시보드로 구현하는 프로젝트에 전염병이나 범죄율 같은 주제를 많이 활용했다는 팀원의 의견에 따라, 전염병 중에서도 모두가 경험한 '코로나'에 관련된 대시보드를 구현해보기로 했다.처음 '코로나 대시보도' 라는 키워드..

[TIL] camp_day52_240701

본캠프 12주차 시작. 오늘은 태블로 과제 풀이와 함께 오랜만에 코딩테스트를 열심히 풀었다.학습 내용숫자를 출력하는 함수들(SQL) : 참고정수로 나타내기SQLABS(숫자) # 절대값 CEIL(숫자) # 가장 가까운 정수 출력, 소숫점 이하 올림 FLOOR(숫자) # 가장 가까운 정수 출력, 소숫점 이하 내림자릿수를 기준으로 반올림 또는 내림하기SQL ROUND(숫자, 자릿수) # 자릿수 바로 전에서 반올림 TRUNCATE(숫자, 자릿수) # 자릿수 바로 전에서 버림몰랐던 함수들SQL GREATEST(num1, num2, num3...) # 숫자들 중에 가장 큰 수만 출력한다 LEAST(num1, num2, num3...) # 숫자들 중에 가장 작은 수만..

[TIL] camp_day51_240627

오늘은... 공부를 안 하고 하루를 그냥 보냈다. 코딩테스트만 몇 문제 풀었는데, 아직 쉬운 문제 구간이라 쉽게 풀렸다.SQL 정규표현식 문제정규표현식 복습!복잡한 검색을 할 때 패턴을 구체화 할 수 있는 강력한 기능단순히 Like ‘%word%’ 문을 쓰는 것을 넘어서, 첫 번째 글자로는 어떤 패턴의 문자가 오고, 중간에 어떤 구조가 반복되고, 맨 마지막에는 어떤 문자로 끝나야 하고, 이렇게 자세한 조건을 걸어서 필터링 할 수 있다.기본적으로 REGEXP 와 RLIKE 는 주어진 문자열이 정규 표현식과 일치하면 True(1)를 반환한다. SQL #1 pattern 일 경우 WHERE column_1 REGEXP 'abc' -- column_1의 행 중에서 'abc'가 포함된 경우 Tru..

[TIL] camp_day50_240626

벌써 부트캠프 11주차도 절반이나 지났다. 오늘부터는 새로운 조에서 태블로를 통한 대시보드 시각화를 학습한다.학습 내용BI 와 태블로BI란?Business Intelligence의 약자로, 조직에서의 데이터 기반 의사 결정을 지원하는 기술, 프로세스, 툴의 집합비즈니스 분석, 데이터 마이닝, 데이터 시각화 등의 데이터 도구BI 도구를 활용해 SQL, Python 보다 데이터를 손쉽게 분석하고 시각화 할 수 있다.Tableau활용하기 좋은 여러 장점을 가지고 있어 널리 쓰이는 BI 툴다양한 형식의 파일(csv, xlsx 등)을 대시보드로 쉽게 만들 수 있고, 활발한 커뮤니티를 통해 여러 자료를 얻기 수월함데이터 용량이 크거나 대시보드의 양이 많아지면 로딩 속도가 느려지고, 가격이 비싸다는 단점도 존재기타 ..

[TIL] camp_day49_240625

약 일주일 조금 넘는 시간 동안 준비한 프로젝트 결과에 대해 발표 후, 피드백을 듣는 것으로 이번 데이터 입문 프로젝트를 마쳤다.밀렸던 TIL과 학습 내용 정리, 그리고 프로젝트 최종 회고를 하는 시간을 가졌다.프로젝트 회고프로젝트 기간 개인 회고 - KPTKeep프로젝트 전체적인 흐름을 파악하고 관리하는 역할과, 프로젝트 내용을 내/외부로 공유하기 쉬운 형태로 가공하는 역할프로젝트를 리드하는 역량까지는 하지 못하더라도, 팀원으로서 한 사람 몫(+@)을 해내는 것Problem프로젝트마다 체감하는 파이썬 역량 부족. 지난 번 프로젝트에 비해 약간 향상되었지만 아직 만족스러울 수준이 아닌 점또 개인적으로는 프로젝트 기간 개인 시간 관리를 조금 더 효율적으로 하고 싶다Try파이썬 기초 학습을 프로젝트 기간에도..

[TIL] camp_day48_240624

어느덧 본캠프 11주차 시작이다. 이번 주는 화요일까지 프로젝트 기간, 나머지 기간은 새로운 학습이 진행될 예정.고찰 & 기타오전까지는 발표 PPT를 수정해서 완성했고, 오후에는 밀렸던 TIL과 주간 회고를 썼다.남은 시간에는 오랜만에 알고리즘 코딩테스트를 풀려고 했는데 잠깐 사이에 머리가 굳었는지 잘 풀리지 않았다...이번 프로젝트를 하면서 파이썬 부족을 너무 체감해서 코드 작성 연습을 좀 더 할 수 있도록 주간 계획을 수정해야겠다.

[TIL] camp_day39_240611

학습 내용지도학습과 비지도학습지도학습 : 정답이 있는 데이터를 통해 결과에 대한 예측을 만들어내는 방법분류와 회귀로 나뉨 : 분류모델은 예측값으로 이산적인 값을 출력하고, 회귀모델은 예측값으로 연속적인 값을 출력선형회귀, 로지스틱회귀, 나이브 베이즈, 의사결정 트리, 랜덤 포레스트, 인공신경망 등의 기법 사용비지도학습 : 정답이 없는 데이터를 분석하여 그 속에서 패턴을 찾거나 데이터를 그룹화시킴군집화와 차원축소로 나뉨두 방법의 차이점지도학습은 일기예보와 같이 새로운 데이터의 결과를 예측한다면, 비지도학습은 이상치 판정과 같이 많은 양의 새로운 데이터에 대하여 통찰력을 얻는다비지도학습은 지도학습에 비해 데이터의 양이 많아야 유효하기 때문에, 범용적으로 활용하는 도메인이 많지 않다.고찰 & 기타통계와 머신..

[WIL] 2024_w23_주간 회고

이번 주의 목표와 달성 : 전체적으로 목표를 높게/많이 설정하기도 했고, 학습 집중력이 많이 떨어져 목표를 전부 달성하지 못했다.머신러닝 기초 강의 완강하기 → [실패]알고리즘 코딩테스트 최소 5문제 풀기 → [미완, 2/5]파이썬 기초 위키독스 120번까지 풀기 → [성공]파이썬 기초 학습반 녹화 강의 수강하고 정리하기 → [실패]SQL 챌린지 과제 : 퍼널 분석 다시 하기 → [실패]깃헙 사용법 익히기 → [실패]이번 주의 학습 키워드 CRUD신뢰구간과 신뢰수준ProgreSQL과 ACID[파이썬] 데이터의 패킹과 언패킹누적합계와 이동합계 이번 주 한 눈에 보기이번주의 KPT_개인Keep- 개인 노션에 일일 진행 사항 기록한 Problem- 계속된 TIL 밀림 - 시간 내 강의 완강을 하지 못함 → 전..