내일배움캠프_데이터분석_2기 78

[TIL] camp_day52_240701

본캠프 12주차 시작. 오늘은 태블로 과제 풀이와 함께 오랜만에 코딩테스트를 열심히 풀었다.학습 내용숫자를 출력하는 함수들(SQL) : 참고정수로 나타내기SQLABS(숫자) # 절대값 CEIL(숫자) # 가장 가까운 정수 출력, 소숫점 이하 올림 FLOOR(숫자) # 가장 가까운 정수 출력, 소숫점 이하 내림자릿수를 기준으로 반올림 또는 내림하기SQL ROUND(숫자, 자릿수) # 자릿수 바로 전에서 반올림 TRUNCATE(숫자, 자릿수) # 자릿수 바로 전에서 버림몰랐던 함수들SQL GREATEST(num1, num2, num3...) # 숫자들 중에 가장 큰 수만 출력한다 LEAST(num1, num2, num3...) # 숫자들 중에 가장 작은 수만..

[TIL] camp_day51_240627

오늘은... 공부를 안 하고 하루를 그냥 보냈다. 코딩테스트만 몇 문제 풀었는데, 아직 쉬운 문제 구간이라 쉽게 풀렸다.SQL 정규표현식 문제정규표현식 복습!복잡한 검색을 할 때 패턴을 구체화 할 수 있는 강력한 기능단순히 Like ‘%word%’ 문을 쓰는 것을 넘어서, 첫 번째 글자로는 어떤 패턴의 문자가 오고, 중간에 어떤 구조가 반복되고, 맨 마지막에는 어떤 문자로 끝나야 하고, 이렇게 자세한 조건을 걸어서 필터링 할 수 있다.기본적으로 REGEXP 와 RLIKE 는 주어진 문자열이 정규 표현식과 일치하면 True(1)를 반환한다. SQL #1 pattern 일 경우 WHERE column_1 REGEXP 'abc' -- column_1의 행 중에서 'abc'가 포함된 경우 Tru..

[TIL] camp_day50_240626

벌써 부트캠프 11주차도 절반이나 지났다. 오늘부터는 새로운 조에서 태블로를 통한 대시보드 시각화를 학습한다.학습 내용BI 와 태블로BI란?Business Intelligence의 약자로, 조직에서의 데이터 기반 의사 결정을 지원하는 기술, 프로세스, 툴의 집합비즈니스 분석, 데이터 마이닝, 데이터 시각화 등의 데이터 도구BI 도구를 활용해 SQL, Python 보다 데이터를 손쉽게 분석하고 시각화 할 수 있다.Tableau활용하기 좋은 여러 장점을 가지고 있어 널리 쓰이는 BI 툴다양한 형식의 파일(csv, xlsx 등)을 대시보드로 쉽게 만들 수 있고, 활발한 커뮤니티를 통해 여러 자료를 얻기 수월함데이터 용량이 크거나 대시보드의 양이 많아지면 로딩 속도가 느려지고, 가격이 비싸다는 단점도 존재기타 ..

[TIL] camp_day49_240625

약 일주일 조금 넘는 시간 동안 준비한 프로젝트 결과에 대해 발표 후, 피드백을 듣는 것으로 이번 데이터 입문 프로젝트를 마쳤다.밀렸던 TIL과 학습 내용 정리, 그리고 프로젝트 최종 회고를 하는 시간을 가졌다.프로젝트 회고프로젝트 기간 개인 회고 - KPTKeep프로젝트 전체적인 흐름을 파악하고 관리하는 역할과, 프로젝트 내용을 내/외부로 공유하기 쉬운 형태로 가공하는 역할프로젝트를 리드하는 역량까지는 하지 못하더라도, 팀원으로서 한 사람 몫(+@)을 해내는 것Problem프로젝트마다 체감하는 파이썬 역량 부족. 지난 번 프로젝트에 비해 약간 향상되었지만 아직 만족스러울 수준이 아닌 점또 개인적으로는 프로젝트 기간 개인 시간 관리를 조금 더 효율적으로 하고 싶다Try파이썬 기초 학습을 프로젝트 기간에도..

[TIL] camp_day48_240624

어느덧 본캠프 11주차 시작이다. 이번 주는 화요일까지 프로젝트 기간, 나머지 기간은 새로운 학습이 진행될 예정.고찰 & 기타오전까지는 발표 PPT를 수정해서 완성했고, 오후에는 밀렸던 TIL과 주간 회고를 썼다.남은 시간에는 오랜만에 알고리즘 코딩테스트를 풀려고 했는데 잠깐 사이에 머리가 굳었는지 잘 풀리지 않았다...이번 프로젝트를 하면서 파이썬 부족을 너무 체감해서 코드 작성 연습을 좀 더 할 수 있도록 주간 계획을 수정해야겠다.

[TIL] camp_day39_240611

학습 내용지도학습과 비지도학습지도학습 : 정답이 있는 데이터를 통해 결과에 대한 예측을 만들어내는 방법분류와 회귀로 나뉨 : 분류모델은 예측값으로 이산적인 값을 출력하고, 회귀모델은 예측값으로 연속적인 값을 출력선형회귀, 로지스틱회귀, 나이브 베이즈, 의사결정 트리, 랜덤 포레스트, 인공신경망 등의 기법 사용비지도학습 : 정답이 없는 데이터를 분석하여 그 속에서 패턴을 찾거나 데이터를 그룹화시킴군집화와 차원축소로 나뉨두 방법의 차이점지도학습은 일기예보와 같이 새로운 데이터의 결과를 예측한다면, 비지도학습은 이상치 판정과 같이 많은 양의 새로운 데이터에 대하여 통찰력을 얻는다비지도학습은 지도학습에 비해 데이터의 양이 많아야 유효하기 때문에, 범용적으로 활용하는 도메인이 많지 않다.고찰 & 기타통계와 머신..

[WIL] 2024_w23_주간 회고

이번 주의 목표와 달성 : 전체적으로 목표를 높게/많이 설정하기도 했고, 학습 집중력이 많이 떨어져 목표를 전부 달성하지 못했다.머신러닝 기초 강의 완강하기 → [실패]알고리즘 코딩테스트 최소 5문제 풀기 → [미완, 2/5]파이썬 기초 위키독스 120번까지 풀기 → [성공]파이썬 기초 학습반 녹화 강의 수강하고 정리하기 → [실패]SQL 챌린지 과제 : 퍼널 분석 다시 하기 → [실패]깃헙 사용법 익히기 → [실패]이번 주의 학습 키워드 CRUD신뢰구간과 신뢰수준ProgreSQL과 ACID[파이썬] 데이터의 패킹과 언패킹누적합계와 이동합계 이번 주 한 눈에 보기이번주의 KPT_개인Keep- 개인 노션에 일일 진행 사항 기록한 Problem- 계속된 TIL 밀림 - 시간 내 강의 완강을 하지 못함 → 전..

[TIL] camp_day37_240607

학습 내용파이썬 기초 위키독스 공부하기(~120번)패킹과 언패킹 : 리스트나 튜플에 값을 넣는 것을 패킹, 묶여있는 값을 풀어내는 것을 언패킹이라고 한다. 즉, 하나 이상의 값을 리스트/튜플에 넣는(묶는) 것 = 패킹리스트/튜플에 저장된 값을 꺼내는(푸는) 것 = 언패킹Pythonscores = [8.8, 8.9, 9.4] # score 라는 변수에 데이터를 리스트로 패킹하기score1, score2, score3 = scores # score 를 score1, score2, score3 으로 언패킹하기 # 언패킹하는 좌변과 우변의 리스트/튜플 내 데이터 개수가 일치해야 한다. # 단, star sxpression(*)을 사용하면 좌변과 우변의 데이터 개수가 일치하지 않아도 된다.scores = ..

[TIL] camp_day36_240605

이번 8주차는 조금 지쳐서 안 열심히 했다. 미래의 내가 감당할 학습량이 늘어나고 있긴 하지만... 그래도 쉬엄쉬엄 공부하는 한 주로 삼아야겠다.학습 내용통계 기초 - A/B test, 유의수준, 검정통계량과 P-valueA/B test가설을 입증하기 위해 대조군과 실험군을 설정하고 검증하는 방법버킷테스트 또는 분할테스트라고도 부르며, 마케팅 고객 데이터 분석 중 가장 널리 사용됨크게 다섯 단계로 진행됨 (1) 현행 데이터 탐색 (2) 가설 설정 (3) 유의수준 설정 (4) 테스트설계 및 실행 (5) 테스트 결과 분석적절한 크기의 표본이 필요하고, 대조군과 실험군은 무작위로 선정되어야 하며, 너무 오랜 기간 진행하거나 너무 많이 시행할 경우 유저 이탈의 원인이 될 수도 있다. 유의수준중심..

[TIL] camp_day35_240604

밀린 TIL 이라 채워넣으면서 복습!학습 내용PostgreSQLSQL 과제를 풀면서 & SQL 코테를 풀면서 조금 학습했는데, 그동안 배웠던 MySQL과 약간 다른 부분이 있어 정리했다.PostgreSQL과 MySQL모두 오픈 소스 관계형 데이터베이스 관리 시스템(RDBMS)둘 다 각자의 장단점이 있다.ProgreSQL은 객체 관계형 DB로, 다루기에는 조금 더 까다롭지만 ACID를 완벽하게 준수하여 복잡한 쿼리와 대규모의 데이터셋에 적합.SQL 표준을 따르므로 다른 RDBMS와의 호환성도 높은 편.금융 시스템, GIS, 복잡한 데이터 처리를 요하는 어플리케이션에서 활용MySQL은 간결함과 속도에 초점을 맟줘 읽기 중심의 작업에 적합.비교적 유연하기 때문에 SQL 표준을 완벽하게 따르지 않아 MySQL에..