Erősítéses tanulás és sztochasztikus optimalizálás: Egységes keretrendszer a szekvenciális döntésekhez

Értékelés:   (4.2 az 5-ből)

Erősítéses tanulás és sztochasztikus optimalizálás: Egységes keretrendszer a szekvenciális döntésekhez (B. Powell Warren)

Olvasói vélemények

Összegzés:

A könyvet a sztochasztikus dinamikus programozás és a megerősített tanulás átfogó és alapos útmutatójaként jellemzik, amely alkalmas az operációkutatásban dolgozó szakemberek számára. Sikeresen összekapcsolja a különböző területeket, köztük a megerősítéses tanulást és az irányításelméletet, miközben egységes keretet biztosít a szekvenciális döntéshozatalhoz. Ugyanakkor számos elgépeléssel és olyan írásmóddal küzd, amelyet egyesek bonyolultnak találhatnak.

Előnyök:

A szekvenciális döntéshozatal fogalmainak átfogó lefedettsége.
Jól megírt és hozzáférhető a különböző hátterű olvasók számára.
Hatékonyan kapcsolja össze a különböző területeket, értékes meglátásokat nyújtva.
Egységes keretet biztosít a szekvenciális döntésekkel foglalkozó számos közösség számára.
Hasznos gyakorlatok és jó referencia a szakemberek számára.

Hátrányok:

Nagyszámú gépelési hiba és kétes jelölésválasztás.
Hiányzik néhány matematikai eredmény levezetése, így az olvasónak magának kell ellenőriznie vagy újra levezetnie.
Az írásmód egyesek számára bonyolult lehet, ami fárasztóvá teszi az olvasást.
A tartalom nagymértékben az operációkutatásra összpontosít, ami elidegenítheti a más háttérrel rendelkezőket, például a gépi tanulással foglalkozókat.

(12 olvasói vélemény alapján)

Eredeti címe:

Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

Könyv tartalma:

MEGERŐSÍTŐ TANULÁS ÉS SZTOCHASZTIKUS OPTIMALIZÁLÁS

A sztochasztikus optimalizálás dzsungelének tisztázása

A "döntés, információ, döntés, döntés, információ" szekvenciális döntési problémák mindenütt jelen vannak, gyakorlatilag minden emberi tevékenységet átfognak, az üzleti alkalmazásoktól kezdve az egészségügyön (személyes és közegészségügy, orvosi döntéshozatal), az energetikán, a tudományokon, a mérnöki tudományok minden területén, a pénzügyeken át az elektronikus kereskedelemig. Az alkalmazások sokfélesége legalább 15 különböző kutatási terület figyelmét keltette fel, nyolc különböző jelölési rendszert használva, amelyek analitikai eszközök széles skáláját eredményezték. Ennek mellékterméke, hogy az egyik közösségben kifejlesztett nagy teljesítményű eszközök más közösségek számára ismeretlenek lehetnek.

A megerősítéses tanulás és a sztochasztikus optimalizálás egyetlen kanonikus keretrendszert kínál, amely bármilyen szekvenciális döntési problémát modellezhet öt alapvető komponens segítségével: állapotváltozók, döntési változók, exogén információs változók, átmeneti függvény és célfüggvény. Ez a könyv kiemeli a bizonytalanság tizenkét típusát, amelyek bármely modellbe beléphetnek, és a döntések meghozatalára szolgáló módszerek, az úgynevezett politikák változatos készletét négy alapvető osztályba sorolja, amelyek átfogják a tudományos irodalomban javasolt vagy a gyakorlatban használt összes módszert.

A Megerősítéses tanulás és sztochasztikus optimalizálás az első olyan könyv, amely kiegyensúlyozottan tárgyalja a szekvenciális döntési problémák modellezésére és megoldására szolgáló különböző módszereket, követve a gépi tanulással, optimalizálással és szimulációval foglalkozó legtöbb könyv által használt stílust. Az ismertetés a valószínűségszámításból és statisztikából tanult, valamint a modellezés és az alkalmazások iránt érdeklődő olvasóknak szól. A lineáris programozást alkalmanként bizonyos problémaosztályok esetében használja. A könyvet olyan olvasók számára tervezték, akik újak a területen, valamint azoknak, akiknek van némi hátterük a bizonytalanság alatti optimalizálásban.

A könyvben az olvasók több mint 100 különböző alkalmazásra találnak hivatkozásokat, amelyek a tiszta tanulási problémák, a dinamikus erőforrás-elosztási problémák, az általános állapotfüggő problémák és a hibrid tanulási/erőforrás-elosztási problémák, például a COVID-járvány során felmerült problémák között találhatók. A könyvben 370 feladat található, hét csoportba rendezve, az áttekintő kérdések, a modellezés, a számítás, a problémamegoldás, az elmélet, a programozási feladatok és egy "naplófeladat" között, amelyet az olvasó a könyv elején választ ki, és amely a könyv további részében a kérdések alapjául szolgál.

A könyv egyéb adatai:

ISBN:9781119815037
Szerző:
Kiadó:
Kötés:Keményfedeles
A kiadás éve:2022
Oldalak száma:1136

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Hozzávetőleges dinamikus programozás - Approximate Dynamic Programmin
Dicséret az első kiadásról "Végre egy könyv, amely a dinamikus programozásnak szentelt és az...
Hozzávetőleges dinamikus programozás - Approximate Dynamic Programmin
Szekvenciális döntéselemzés és modellezés: Modellezés Pythonnal - Sequential Decision Analytics and...
A szekvenciális döntési problémák gyakorlatilag...
Szekvenciális döntéselemzés és modellezés: Modellezés Pythonnal - Sequential Decision Analytics and Modeling: Modeling with Python
Modern megközelítés az optimalizálás bevezetésének tanításához - A Modern Approach to Teaching an...
Az optimalizálásnak a lehető legjobb döntések...
Modern megközelítés az optimalizálás bevezetésének tanításához - A Modern Approach to Teaching an Introduction to Optimization
Erősítéses tanulás és sztochasztikus optimalizálás: Egységes keretrendszer a szekvenciális...
MEGERŐSÍTŐ TANULÁS ÉS SZTOCHASZTIKUS OPTIMALIZÁLÁS A...
Erősítéses tanulás és sztochasztikus optimalizálás: Egységes keretrendszer a szekvenciális döntésekhez - Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions

A szerző munkáit az alábbi kiadók adták ki: