Mulit-Armed Bandit (1)

2020-03-10

본격적인 강화학습 알고리즘에 대한 공부에 앞서, Multi-armed Banit Problem에 대해 살펴보려 한다. MAB는 강화학습에 기초가 되는 컨셉이자, 한 분야이다. 최근들어 이를 잘 활용한 알고리즘들이 다양한 분야에서 응용되고 각광받고 있다.

Read More