Regret Analysis of Stochastic and Nonstochastic Multi-Armed Bandit Problems

Sztochasztikus és nem sztochasztikus többfegyveres bandit problémák regret-elemzése (Bastian Bubeck S.)

Olvasói vélemények

Jelenleg nincsenek olvasói vélemények. Az értékelés 2 olvasói szavazat alapján történt.

Eredeti címe:

Regret Analysis of Stochastic and Nonstochastic Multi-Armed Bandit Problems

Könyv tartalma:

A többkarú bandita probléma - vagy egyszerűen bandita probléma - egy cselekvések halmaza által meghatározott szekvenciális allokációs probléma. Minden egyes időlépésnél egy egységnyi erőforrást rendelünk egy akcióhoz, és valamilyen megfigyelhető kifizetést kapunk.

A cél az allokációk sorozatában kapott teljes kifizetés maximalizálása. A bandita elnevezés a nyerőgép köznyelvi elnevezésére utal (az amerikai szlengben "egykarú bandita"). Egy kaszinóban szekvenciális allokációs problémát akkor kapunk, ha a játékos egyszerre több nyerőgéppel áll szemben ("többkarú bandita"), és többször kell kiválasztania, hogy hova dobja be a következő érmét.

A többkarú bandita problémák a legegyszerűbb példái a feltárás-kihasználás kompromisszumot tartalmazó szekvenciális döntési problémáknak. Ez az egyensúlyt jelenti a múltban a legmagasabb nyereséget adó lehetőségnél való maradás és a jövőben esetleg magasabb nyereséget adó új lehetőségek felkutatása között.

Bár a bandita-problémák tanulmányozása az 1930-as évekre nyúlik vissza, a felfedezés-kihasználás kompromisszum számos modern alkalmazásban, például a reklámok elhelyezésében, a webhelyek optimalizálásában és a csomagátirányításban is felmerül. Matematikailag a többkarú banditát az egyes lehetőségekhez kapcsolódó kifizetési folyamat határozza meg. Ebben a könyvben a hangsúly két olyan szélsőséges esetre helyeződik, amelyekben a sajnálkozás elemzése különösen egyszerű és elegáns: a független és azonos eloszlású kifizetések és az ellenséges kifizetések.

A véges számú akciók alaphelyzetén kívül elemzi a legfontosabb változatait és kiterjesztéseit is, például a kontextuális bandita modellt. Ez a monográfia ideális referencia a banditproblémák iránt érdeklődő hallgatók és kutatók számára.

A könyv egyéb adatai:

ISBN:	9781601986269
Szerző:	Bastian Bubeck S.
Kiadó:	New Publ Inc
Nyelv:	angol
Kötés:	Puha kötés

Vásárlás:

Jelenleg kapható, készleten van.

Sztochasztikus és nem sztochasztikus többfegyveres bandit problémák regret-elemzése

Olvasói vélemények

Eredeti címe:

Könyv tartalma:

A könyv egyéb adatai:

Vásárlás:

A szerző további könyvei:

A szerző munkáit az alábbi kiadók adták ki: