분산, 표준편차
값이 평균보다 얼마나 벗어나 있는 지를 나타내는 값 (이탈도, deviation)
x-는 평균을 뜻함
중심극한정리(Central Limit Theorem)
표본 평균으로 모평균을 추정할 수 있다.
표본이 얼마나 믿을 만 한가?
작은 표본들의 평균들의 분포는 모평균과 상관없이 정규분포에 가까워짐
표준오차
모평균 : 추정하고 싶은 정답
표본평균 : 모평균의 추정치
오차 : 모평균과 표본평균의 차이
표준 오차 : 표준평균분포의 표준편차
표준오차 : 표본을 가지고 모평균에서 추정했을때, 추정치에서의 오차
(표준오차)SE = 데이터가 많으면 표준편차가 줄어든다.
95% 신뢰구간
100번 정도 뽑으면 95번 정도는 95% 신뢰구간 안에 모평균을 포함한다.
즉, 신뢰구간 안에 모평균이 포함될 확률이 95%이다.
'KT AIVLE School > 데이터 분석 및 의미 찾기' 카테고리의 다른 글
이변량 분석 : 숫자 → 범주 (0) | 2024.09.13 |
---|---|
이변량 분석 : 범주 → 범주 (0) | 2024.09.13 |
이변량 분석 : 범주 → 숫자 (0) | 2024.09.12 |
이변량 분석 : 숫자 → 숫자 (0) | 2024.09.11 |
가설검정 (0) | 2024.09.11 |