BESS(Back-End Study Space)

기술통계와 추리통계 본문

데이터 분석 입문/기초통계

기술통계와 추리통계

leeez 2020. 11. 16. 14:19

#1. 기술 통계

수집한 자료를 분석하여 대상들의 속성을 파악하는 통계 방법

> 1. 중심경향값 : 전체 자료를 대표할 수 있는 수치들

- 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로 나눈 수치

- 중앙값 : 최대값과 최소값의 정가운데 수치

- 최빈값 : 가장 많은 빈도를 보이는 수치

> 2. 분산도 : 전체 자료가 얼마나 퍼져 있는지를 알 수 있는 수치

- 분산 : 각 자료가 평균으로부터 떨어진 거리(편차)들을 제곱한 수치들의 총합을 전체 자료의 수로 나눈 수치

- 표준편차 : 분산에 제곱근을 취한 수치

> 3. 상관계수 : 두 변수 간의 관계의 크기

> 4. 회귀계수 : 독립변수(원인)가 종속변수(결과)에 미치는 영향의 크기

 

#2. 추리 통계

모집단을 대표하는 표본을 추출하고 표본의 기술통계를 이용하여 모집단의 속성들을 유추하는 통계방법

☞ 모집단에서 표본을 추출할 때 오류 발생 가능성 존재 → 표본집단에서 얻은 수치들이 모집단의 수치임을 확신할 수 없음

> 1. 신뢰구간 : 추리통계에서 예측한 모집단의 특성이 위치할 가능성이 높은 구간

  • 표본에서 구해지는 기술 통계값들을 이용하여 계산되며, 95%, 99%, 99.9% 신뢰수준에서 따라 달라짐
  • 정확도를 높이기 위해 신뢰구간의 영역을 넓힘 ( 95% → 99% → 99.99%)