Értékelés:

A könyvet a sztochasztikus dinamikus programozás és a megerősített tanulás átfogó és alapos útmutatójaként jellemzik, amely alkalmas az operációkutatásban dolgozó szakemberek számára. Sikeresen összekapcsolja a különböző területeket, köztük a megerősítéses tanulást és az irányításelméletet, miközben egységes keretet biztosít a szekvenciális döntéshozatalhoz. Ugyanakkor számos elgépeléssel és olyan írásmóddal küzd, amelyet egyesek bonyolultnak találhatnak.
Előnyök:⬤ A szekvenciális döntéshozatal fogalmainak átfogó lefedettsége.
⬤ Jól megírt és hozzáférhető a különböző hátterű olvasók számára.
⬤ Hatékonyan kapcsolja össze a különböző területeket, értékes meglátásokat nyújtva.
⬤ Egységes keretet biztosít a szekvenciális döntésekkel foglalkozó számos közösség számára.
⬤ Hasznos gyakorlatok és jó referencia a szakemberek számára.
⬤ Nagyszámú gépelési hiba és kétes jelölésválasztás.
⬤ Hiányzik néhány matematikai eredmény levezetése, így az olvasónak magának kell ellenőriznie vagy újra levezetnie.
⬤ Az írásmód egyesek számára bonyolult lehet, ami fárasztóvá teszi az olvasást.
⬤ A tartalom nagymértékben az operációkutatásra összpontosít, ami elidegenítheti a más háttérrel rendelkezőket, például a gépi tanulással foglalkozókat.
(12 olvasói vélemény alapján)
Reinforcement Learning and Stochastic Optimization: A Unified Framework for Sequential Decisions
MEGERŐSÍTŐ TANULÁS ÉS SZTOCHASZTIKUS OPTIMALIZÁLÁS
A sztochasztikus optimalizálás dzsungelének tisztázása
A "döntés, információ, döntés, döntés, információ" szekvenciális döntési problémák mindenütt jelen vannak, gyakorlatilag minden emberi tevékenységet átfognak, az üzleti alkalmazásoktól kezdve az egészségügyön (személyes és közegészségügy, orvosi döntéshozatal), az energetikán, a tudományokon, a mérnöki tudományok minden területén, a pénzügyeken át az elektronikus kereskedelemig. Az alkalmazások sokfélesége legalább 15 különböző kutatási terület figyelmét keltette fel, nyolc különböző jelölési rendszert használva, amelyek analitikai eszközök széles skáláját eredményezték. Ennek mellékterméke, hogy az egyik közösségben kifejlesztett nagy teljesítményű eszközök más közösségek számára ismeretlenek lehetnek.
A megerősítéses tanulás és a sztochasztikus optimalizálás egyetlen kanonikus keretrendszert kínál, amely bármilyen szekvenciális döntési problémát modellezhet öt alapvető komponens segítségével: állapotváltozók, döntési változók, exogén információs változók, átmeneti függvény és célfüggvény. Ez a könyv kiemeli a bizonytalanság tizenkét típusát, amelyek bármely modellbe beléphetnek, és a döntések meghozatalára szolgáló módszerek, az úgynevezett politikák változatos készletét négy alapvető osztályba sorolja, amelyek átfogják a tudományos irodalomban javasolt vagy a gyakorlatban használt összes módszert.
A Megerősítéses tanulás és sztochasztikus optimalizálás az első olyan könyv, amely kiegyensúlyozottan tárgyalja a szekvenciális döntési problémák modellezésére és megoldására szolgáló különböző módszereket, követve a gépi tanulással, optimalizálással és szimulációval foglalkozó legtöbb könyv által használt stílust. Az ismertetés a valószínűségszámításból és statisztikából tanult, valamint a modellezés és az alkalmazások iránt érdeklődő olvasóknak szól. A lineáris programozást alkalmanként bizonyos problémaosztályok esetében használja. A könyvet olyan olvasók számára tervezték, akik újak a területen, valamint azoknak, akiknek van némi hátterük a bizonytalanság alatti optimalizálásban.
A könyvben az olvasók több mint 100 különböző alkalmazásra találnak hivatkozásokat, amelyek a tiszta tanulási problémák, a dinamikus erőforrás-elosztási problémák, az általános állapotfüggő problémák és a hibrid tanulási/erőforrás-elosztási problémák, például a COVID-járvány során felmerült problémák között találhatók. A könyvben 370 feladat található, hét csoportba rendezve, az áttekintő kérdések, a modellezés, a számítás, a problémamegoldás, az elmélet, a programozási feladatok és egy "naplófeladat" között, amelyet az olvasó a könyv elején választ ki, és amely a könyv további részében a kérdések alapjául szolgál.