Markov Decision Process
2020-04-20
Ph.D student at the Graduate School of AI, KAIST
본격적인 강화학습 알고리즘에 대한 공부에 앞서, Multi-armed Banit Problem에 대해 살펴보려 한다. MAB는 강화학습에 기초가 되는 컨셉이자, 한 분야이다. 최근들어 이를 잘 활용한 알고리즘들이 다양한 분야에서 응용되고 각광받고 있다.