Értékelés:

Jelenleg nincsenek olvasói vélemények. Az értékelés 2 olvasói szavazat alapján történt.
Regret Analysis of Stochastic and Nonstochastic Multi-Armed Bandit Problems
A többkarú bandita probléma - vagy egyszerűen bandita probléma - egy cselekvések halmaza által meghatározott szekvenciális allokációs probléma. Minden egyes időlépésnél egy egységnyi erőforrást rendelünk egy akcióhoz, és valamilyen megfigyelhető kifizetést kapunk.
A cél az allokációk sorozatában kapott teljes kifizetés maximalizálása. A bandita elnevezés a nyerőgép köznyelvi elnevezésére utal (az amerikai szlengben "egykarú bandita"). Egy kaszinóban szekvenciális allokációs problémát akkor kapunk, ha a játékos egyszerre több nyerőgéppel áll szemben ("többkarú bandita"), és többször kell kiválasztania, hogy hova dobja be a következő érmét.
A többkarú bandita problémák a legegyszerűbb példái a feltárás-kihasználás kompromisszumot tartalmazó szekvenciális döntési problémáknak. Ez az egyensúlyt jelenti a múltban a legmagasabb nyereséget adó lehetőségnél való maradás és a jövőben esetleg magasabb nyereséget adó új lehetőségek felkutatása között.
Bár a bandita-problémák tanulmányozása az 1930-as évekre nyúlik vissza, a felfedezés-kihasználás kompromisszum számos modern alkalmazásban, például a reklámok elhelyezésében, a webhelyek optimalizálásában és a csomagátirányításban is felmerül. Matematikailag a többkarú banditát az egyes lehetőségekhez kapcsolódó kifizetési folyamat határozza meg. Ebben a könyvben a hangsúly két olyan szélsőséges esetre helyeződik, amelyekben a sajnálkozás elemzése különösen egyszerű és elegáns: a független és azonos eloszlású kifizetések és az ellenséges kifizetések.
A véges számú akciók alaphelyzetén kívül elemzi a legfontosabb változatait és kiterjesztéseit is, például a kontextuális bandita modellt. Ez a monográfia ideális referencia a banditproblémák iránt érdeklődő hallgatók és kutatók számára.