BESS(Back-End Study Space)

공분산과 상관계수 본문

데이터 분석 입문/기초통계

공분산과 상관계수

leeez 2020. 11. 17. 21:23

2020/11/17 - [데이터 분석 입문/기초통계] - 도수분포표와 막대그래프, 히스토그램

 

도수분포표와 막대그래프, 히스토그램

2020/11/17 - [데이터 분석 입문/기초통계] - 모집단과 통계, 척도 모집단과 통계, 척도 2020/11/16 - [데이터 분석 입문/기초통계] - 기술통계와 추리통계 1. 중심경향값 : 전체 자료를 대표할 수 있는 수

leeezxxswd.tistory.com

#1. 공분산

A와 B의 공분산



- 범위 : (-∞ , +∞)
- A(i) - A(^) : 각 케이스들의 평균으로부터의 거리 (=편차)

- 두 변수가 함께 각자의 평균으로부터 멀어지는 정도
- 한 변수가 자신의 평균으로부터 멀어질 때 다른 변수가 자신의 평균으로부터 멀어지는 정도를 의미

 

#2. 상관계수

두 변수 간의 관계로, 하나의 변수가 변화함에 따라 다른 변수가 변화하는 정도를 의미

- 범위 : (-1 , 1)
- Sa : a의 표준편차
- Sb : b의 표준편차
- 공분산을 표준편차들의 곱으로 나눔으로써 '표준화'가 이루어졌다.
표준화 : 다양한 자료들이 서로 상이한 평균과 분포를 보임에 따라
    서로 비교할수가 없으므로 모든 자료들을 평균이 0, 표준편차를 1로 만들어줌

- 예시



- 무의미한 상관관계 : 한 변수가 아무리 증가하더라도 다른 변수가 전혀 변하지 않는 경우

 

 



- 상관관계의 대각선은 모두 1
: 자신과 자신의 관계는 언제나 퍼펙트한 결과
- 대각선을 중심으로 상하좌우는 서로 대칭 : 두 변수간의 관계이기 때문에 대칭되는 값 하나만 보면 됨


- 해석 :
1 ) 팀 효능감(1) ↔ 팀 내 정치자각(2) : -0.28
     음의 상관관계를 가지므로 팀 효능감(1)이 증가하면 팀 내 정치자각(2)은 감소한다
2) 팀 효능감(1) ↔ 자기효능감(3) : 0.37
     양의 상관관계를 가지므로 팀 효능감(1)이 증가하면 자기효능감(3)도 증가한다
3) 팀 내 정치자각(2) ↔ 자기효능감(3) : -0.07
     무의미한 상관관계를 가지므로 두 변수간에 관련성이 거의 없다