BESS(Back-End Study Space)

모집단과 통계, 척도 본문

데이터 분석 입문/기초통계

모집단과 통계, 척도

leeez 2020. 11. 17. 16:35

2020/11/16 - [데이터 분석 입문/기초통계] - 기술통계와 추리통계

 

기술통계와 추리통계

#1. 기술 통계 수집한 자료를 분석하여 대상들의 속성을 파악하는 통계 방법 > 1. 중심경향값 : 전체 자료를 대표할 수 있는 수치들 - 평균 : 전체 자료가 가지는 수치들의 총합을 전체 자료의 수로

leeezxxswd.tistory.com

#1. 모집단 : 연구 또는 분석이 이루어지는 전체 대상

- 전수조사하기 위해서는 많은 시간과 노력 필요
- 전수조사가 불가능한 경우, 모집단을 대표할 수 있는 표본을 추출

 

#2. 표본 : 모집단에서 추출한 일부로, 모집단의 속성들을 유추하는데 사용

> 1. 확률 표본 추출 방법
  :  무작위로 표본을 추출하는 방법으로 모집단을 대표할 가능성이 높은 방법
      - 체계적으로 표본이 추출되기 때문에 많은 시간이 필요

> 2. 비확률표본추출방법
  :  조사자의 편의나 판단에 의해서 표본을 추출하는 방법으로 모집단을 대표하지 않을 가능성이 존재하는 방법
     
- 쉽게 표본을 추출하기 때문에 실제 연구나 조사에서 많이 활용됨

☞ 표본을 얼마나 추출해야 모집단을 대표할 수 있을까? → 중심극한정리 사용

 

#3. 중심극한정리

-표본이 30 이상으로 충분히 클 때
1) 모집단의 분포와 상관없이 표본은 정규분포를 이룬다.
2) 표본의 평균 = 모집단의 평균
    자유도: 평균을 유지하면서 자유롭게 어떠한 값도 가질 수 있는 사례의 수 ( N-1 )

표본 통계치에 활용되는 다양한 자유도 개념 예시

예 )        모집단 평균 : 3
                            ▼ 4개 추출
       표본 평균 : ( x1 + x2 + x3 + x4 ) / 4 = 3
- 4개의 표본 중 3개는 자유롭게 추출해도 상관없지만 나머지 1개는 평균이 3이 될 수 있는 수치어야 함.
-
4개의 표본 추출 시, 자유롭게 정할 수 있는 수치(=자유도)는 3(=4-1)이다.

3) 표본의 분산 = (모집단의 분산) / (표본의 수)

 

#4. 척도

척도에 따라 분석방법이 달라지고, 실제 데이터는 다양한 척도에 따라 얻게 된다.

- 척도의 원칙
> 1. 포괄성 : 척도 안에 모든 경우의 수가 포함되어야 한다는 원칙

> 2. 상호배타성 : 척도 안에 중복되는 경우의 수가 없어야 한다는 원칙

- 척도 유형
> 1. 명목척도 : 측정이 이루어지는 항목들이 상호배타적인 특성만을 가진 척도
      예 )  당신의 성별은? (1)남성 (2)여성
> 2. 서열척도 : 명목척도들 중 항목들 간에 서열이나 순위가 존재하는 척도
      예 )  당신의 최종 학력은? (1)고졸 이하 (2)전문대졸 (3)4년대졸 (4)대학원졸 이상
▷ 명목척도, 서열척도의 경우, 각 항목들이 독립적인 집단을 구성할 수 있음 ☞ "비연속형 변수", "이산변수"
> 3. 등간척도 : 서열척도들 중 항목들 간의 간격이 일정한 척도
      예 )  당신의 직무에 대해 얼마나 만족하십니까? (1)전혀 만족하지 못한다 (2)거의 만족하지 못한다 (3)보통이다 (4)약간 만족한다 (5)매우 만족한다
> 4. 비율척도 : 등간척도 중 아무것도 없는 상태를 '0'으로 정할 수 있는 척도
      예 ) 당신의 연령은? (_______)세  ☞ '0'이라는 개념을 아직 태어나지 않은 상태로 특정할 수 있음   ▶ '등간척도' (ㅇ) '비율척도 (ㅇ)
            온도는? (________)도 ☞ 온도는 '0'도 일지라도, 온도가 '없다'라고 표현할 수 없다 ▶ '등간척도' (ㅇ) '비율척도' (x)
▷ 등간척도, 비율척도의 경우, 각 항목들의 간격이 일정함 ☞ "연속형 변수"