학습 내용
CRUD
- CRUD란? : 저장된 데이터에 대해 작업할 수 있는 방법의 약어로, 일반적으로 데이터베이스나 데이터 저장소에서 수행되는 작업을 의미
- Create / Read / Update / Delete 의 앞글자를 딴 것.
- 코테 풀고 답안 보다가, 등장한 용어라 찾아 보았다.
통계 라이브 강의
데이터의 종류
- 크게 수치형 데이터와 범주형 데이터로 나뉨.
- 수치형 : 연속형과 이산형 데이터
- 범주형 : 가능한 범주 안의 값만 취하는 데이터. 드롭다운 박스에서 값을 선택하는 것과 비슷함.
범주형에는 이진형과 순서형 이 포함된다.
편차, 분산, 표준편차
- 편차 : 평균으로부터 값이 얼마나 떨어져 있는지 / 평균으로부터 떨어져 있는 방향에 따라 양수일수도, 음수일수도 있다.
- 분산 : 편차는 양수와 음수 둘 다 가능하기 때문에 편차의 합이 0이 되는 것을 방지하기 위해, 편차 제곱합의 평균을 낸 것
- 표준편차 : 분산에 제곱근을 취한 값 / 분산은 제곱하여 구한 값이기 때문에 제곱근을 취하여 원래 단위로 되돌린다.
정규분포와 신뢰구간
- 정규분포 : 평균과 분산에 따라 다른 형태를 가지며, 좌우대칭의 형태로 평균치에서 그 값이 도출될 확률이 가장 높다.
- 평균 0, 분산 1을 가지는 경우를 표준정규분포라고 함.
- 표준정규분포는 분포의 평균과 분산 값을 통일하는 과정!
- 신뢰구간과 신뢰수준
- 모든 데이터는 표본을 추출하는 순간 불확실성을 가짐
- 신뢰구간 : 특정 범위 내에 값이 존재할 것으로 예측되는 영역
- 신뢰수준 : 실제 모수를 측정할 때, 몇 퍼센트의 확률로 신뢰구간이 실제 모수를 포함하게 되는지. 주로 95%와 99% 사용.
- 정규분포 : 평균과 분산에 따라 다른 형태를 가지며, 좌우대칭의 형태로 평균치에서 그 값이 도출될 확률이 가장 높다.
'내일배움캠프_데이터분석_2기 > TIL' 카테고리의 다른 글
[TIL] camp_day36_240605 (0) | 2024.06.05 |
---|---|
[TIL] camp_day35_240604 (0) | 2024.06.04 |
[TIL] camp_day33_240531 (1) | 2024.06.03 |
[TIL] camp_day32_240530 (0) | 2024.05.30 |
[TIL] camp_day31_240529 (0) | 2024.05.29 |