BESS(Back-End Study Space)

강화학습 (Reinforcement Learning) 본문

데이터 분석 입문/머신러닝

강화학습 (Reinforcement Learning)

leeez 2020. 11. 30. 15:44

2020/11/30 - [데이터 분석 입문/머신러닝] - 비지도학습 (Unsupervised Learning)

 

비지도학습 (Unsupervised Learning)

2020/11/29 - [데이터 분석 입문/머신러닝] - 회귀 (Regression) 회귀 (Regression) 2020/11/29 - [데이터 분석 입문/머신러닝] - 분류 (Classification) 분류 (Classification) 2020/11/29 - [데이터 분석 입문/..

leeezxxswd.tistory.com

#1. 강화학(Reinforcement Learning)

- 자신이 한 행동에 대한 "보상"을 바탕으로 목적을 달성하는 학습
- 아이가 걷는 과정을 배우는 것, 자전거를 배우는 과정과 유사

-'agent'가 'environment'안에서 어떤 'action'을 취했을 때 'agent(나)'의 'state'가 어떻게 변화했는지를 알게 되고, 그에 따란 'reward'를 얻음

- 이 과정을 반복하면서 'agent'가 'reward'를 최대화 하기 위한 방향의 행동을 계속 선택하게 될 것

- 예 ) Game AI : '보상'이 명확함.
 * Google DeepMind's Deep Q-learning playing Atari Breakout
 * 데브시스터즈 : 쿠키런 (By Taehoon Kim)