BESS(Back-End Study Space)

분류 (Classification) 본문

데이터 분석 입문/머신러닝

분류 (Classification)

leeez 2020. 11. 29. 14:01

2020/11/29 - [데이터 분석 입문/머신러닝] - 지도학습 (Supervised Learning)

 

지도학습 (Supervised Learning)

2020/11/29 - [데이터 분석 입문/머신러닝] - 머신러닝(Machine Learning) 머신러닝(Machine Learning) #1. 머신러닝 - 컴퓨터가 데이터를 학습하는 알고리즘과 기술을 통칭 - 컴퓨터과학과 수학, 통계가 모두 필

leeezxxswd.tistory.com

#1. 분류 (Classification)

- 타겟변수 Y가 이산형 변수(discrete variable)인 경우
- 이산형변수 : 특정한 값(가질 수 있는 값이 유한정)만 가질 수 있는 변수로, 각 값이 몇 번 나타났는지 셀 수 있다.
- 분류모델이 만들어지기 위해서는 학습 알고리즘이 필요

- 학습 알고리즘(Learning Algorithm)의 목표
☞ 주어진 학습용 데이터셋을 활용하여
     1. 의사결정경계(decision boundary)를 찾고
     2. 모델을 설계
- Model or Classifier
   aX1 + bX2 + c ≥ 0 이면 'Class 1'로 분류
   aX1 + bX2 + c < 0 이면 'Class 2'로 분류





Prediction : Classify a new point
? (a new point)
→ Model or Classifier ■ ('Class 2')
: ?의 X1, X2좌표를 모델의 식에 넣어봤을 때 의사결정경계의 아래쪽에 위치하므로 값이 0보다 작다 ☞ 'Class 2'로 분류