BESS(Back-End Study Space)
강화학습 (Reinforcement Learning) 본문
2020/11/30 - [데이터 분석 입문/머신러닝] - 비지도학습 (Unsupervised Learning)
#1. 강화학습 (Reinforcement Learning)
- 자신이 한 행동에 대한 "보상"을 바탕으로 목적을 달성하는 학습
- 아이가 걷는 과정을 배우는 것, 자전거를 배우는 과정과 유사
-'agent'가 'environment'안에서 어떤 'action'을 취했을 때 'agent(나)'의 'state'가 어떻게 변화했는지를 알게 되고, 그에 따란 'reward'를 얻음
- 이 과정을 반복하면서 'agent'가 'reward'를 최대화 하기 위한 방향의 행동을 계속 선택하게 될 것
- 예 ) Game AI : '보상'이 명확함.
* Google DeepMind's Deep Q-learning playing Atari Breakout
* 데브시스터즈 : 쿠키런 (By Taehoon Kim)
'데이터 분석 입문 > 머신러닝' 카테고리의 다른 글
파라미터(Parameter)와 하이퍼파라미터(Hyperparameter) (0) | 2020.12.04 |
---|---|
신경망모델(Neural Networks)과 딥러닝(Deep Learning) (0) | 2020.12.04 |
비지도학습 (Unsupervised Learning) (0) | 2020.11.30 |
회귀 (Regression) (0) | 2020.11.29 |
분류 (Classification) (0) | 2020.11.29 |