
Bayesian Reinforcement Learning: A Survey
A gépi tanulás Bayes-módszereit széles körben vizsgálták, és elvi módszereket dolgoztak ki az előzetes információk következtetési algoritmusokba való beépítésére. Ez a monográfia alapos áttekintést nyújt az olvasónak a Bayes-módszerek szerepéről a megerősített tanulás (RL) paradigmájában.
A bayesi érvelés RL-be való beépítésének fő ösztönzői az, hogy elegáns megközelítést nyújt a cselekvésválasztáshoz (felfedezés/kiaknázás) a tanulás bizonytalanságának függvényében, és gépezetet biztosít az előzetes tudás beépítéséhez az algoritmusokba. Bayesi megerősítő tanulás: A Survey először a Bayes-féle következtetés modelljeit és módszereit tárgyalja az egyszerű, egylépéses Bandit-modellben. Ezután áttekinti a modellalapú RL Bayes-módszerekről szóló kiterjedt legújabb szakirodalmat, ahol az előzetes információ kifejezhető a Markov-modell paramétereiről.
Bemutatja továbbá a modellmentes RL Bayes-módszereit, ahol a prioritásokat az értékfüggvény vagy a politikaosztály felett fejezzük ki. Bayesi megerősítéses tanulás: A Survey: A Survey egy átfogó referencia a Bayesian RL algoritmusok és azok elméleti és empirikus tulajdonságai iránt érdeklődő hallgatók és kutatók számára.