BESS(Back-End Study Space)
로지스틱 회귀분석 본문
2020/11/19 - [데이터 분석 입문/기초통계] - 회귀분석
#1. 로지스틱 회귀분석
- 독립변수가 연속형 변수지만, 종속변수가 비연속형 변수(특히, 이분형변수 : 경우의 수가 2가지(1. 발생하거나 2. 발생하지 않거나)인 경우에는 사용하는 분석방법
* 이분형 변수 : 경우의 수가 2개밖에 없는 변수로, 어떠한 사건이 발생하거나 발생하지 않는 경우밖에 없는 변수
예시 ) 물건을 산다 / 안산다, 회사를 관둔다 / 관두지 않는다 ...
- OLS 방식처럼 파란색의 직선으로 표시할 경우, 오차가 커지게 됨
- 빨간색의 곡선처럼 만들어지면 오차가 최소화됨
- 빨간색의 곡선 : 로그함수와 같은 모양으로 로그함수를 통해 분석함
- 로지스틱 회귀분석의 원리
> 1. Odd Ratio = p / (1-p) ☞ 특정 사건이 발생할 확률과 발생하지 않을 확률 간의 비율
> 2. 로지스틱 회귀식 : 회귀분석에서 종속변수(y)를 Odd Ratio에 자연로그를 취한 값으로 대체
- x : 독립변수
- b0 : y절편
- b1 : 기울기(회귀계수)
· 회귀분석과 다른 점
- 회귀계수 검증 방법 다름
- b1 > 0 : x가 증가할수록 특정 사건이 발생하지 않을 확률보다 발생할 확률이 높다는 의미
- b1 < 0 : x가 증가할수록 특정 사건이 발생할 확률보다 발생하지 않을 확률이 높다는 의미
#2. 로지스틱 회귀분석 대표 가설
- H0 : 독립변수가 종속변수에 미치는 영향의 크기는 '0'이다.
- H1 ( 양측검증 ) : 독립변수가 종속변수에 미치는 영향의 크기는 '0'이 아니다.
- H1 ( 단측검증 ) : 독립변수가 종속변수에 미치는 영향의 크기는 '0'보다 크다.
#3. 모형적합도
- 모형이 적절하게 만들어졌는지를 보여주는 지표
- 로지스틱 회귀분석에서는 모형(회귀식)에 포함된 독립변수들에 의해서 종속변수가 설명되어지는 부분, 즉 발생할 확률과 발생하지 않을 확률의 비율을 얼만큼 설명하는 가
- 대표적으로 X^2-수치, -2log 우도 등이 사용
'데이터 분석 입문 > 기초통계' 카테고리의 다른 글
구조방정식모형 (0) | 2020.11.27 |
---|---|
조절효과와 매개효과 (0) | 2020.11.20 |
회귀분석 (0) | 2020.11.19 |
분산분석 (ANOVA) (0) | 2020.11.19 |
t-분석 (0) | 2020.11.19 |