Értékelés:

A könyv világos és olvasmányos bevezetést nyújt a megerősített tanulás és a dinamikus programozás témakörébe, így alkalmas az önálló tanulásra. Hatékonyan magyarázza el a fogalmakat, és jó példákat kínál. Néhány olvasó azonban problémákat észlelt a Kindle-verzióval kapcsolatban, és megjegyezte, hogy más szövegektől eltérő jelöléseket részesített előnyben.
Előnyök:⬤ Nagyon olvasmányos és világos magyarázatok
⬤ jó áttekintést nyújt a megerősítéses tanulásról és a dinamikus programozásról
⬤ hasznos példákat és megvalósítási tippeket tartalmaz
⬤ jól használható kezdők számára.
Problémák a Kindle változat formázásával; a jelölésmód eltér Bertsekas műveitől, ami egyes olvasókat összezavarhat.
(7 olvasói vélemény alapján)
Approximate Dynamic Programmin
Dicséret az első kiadásról
"Végre egy könyv, amely a dinamikus programozásnak szentelt és az operációkutatás (OR) nyelvén íródott Ez a gyönyörű könyv hiánypótló az OR-szakértők és -gyakorlók könyvtárában.".
-- Számítástechnikai vélemények
Ez az új kiadás a közelítő dinamikus programozási problémák összetett osztályainak modellezésére és számítására összpontosít.
A közelítő dinamikus programozás (ADP) megértése létfontosságú ahhoz, hogy komplex ipari problémákra gyakorlati és magas színvonalú megoldásokat lehessen kidolgozni, különösen akkor, ha ezek a problémák bizonytalanság jelenlétében történő döntéshozatalt igényelnek. A Közelítő dinamikus programozás, második kiadás egyedülálló módon integrál négy különböző tudományágat - Markov-döntési folyamatok, matematikai programozás, szimuláció és statisztika -, hogy bemutassa, hogyan lehet sikeresen megközelíteni, modellezni és megoldani a valós problémák széles körét az ADP segítségével.
A könyv továbbra is áthidalja az informatika, a szimuláció és az operációkutatás közötti szakadékot, és most a megerősítő tanulás, valamint a sztochasztikus keresés és a szimulációs optimalizálás jelölésmódját és szókincsét alkalmazza. A szerző felvázolja az alapvető algoritmusokat, amelyek kiindulópontként szolgálnak a valós problémák gyakorlati megoldásainak megtervezéséhez. Bemutatja a dimenzió három átkát, amelyek hatással vannak az összetett problémákra, és részletesen kitér a megvalósítási kihívásokra. A második kiadás a következőket is tartalmazza:
⬤ Új fejezet, amely a különféle sztochasztikus optimalizálási problémákkal való munkához szükséges irányelvek négy alapvető osztályát írja le: a rövidlátó irányelvek, a look-ahead irányelvek, az irányelvfüggvények közelítései és az értékfüggvények közelítésén alapuló irányelvek.
⬤ Új fejezet a szabályzatkeresésről, amely egyesíti a sztochasztikus keresés és a szimulációs optimalizálás fogalmait, és bemutatja az optimális tanulási stratégiák új osztályát.
⬤ A felderítés-kiaknázás problémájának frissített lefedése az ADP-ben, most már egy nemrégiben kifejlesztett módszert is tartalmaz az aktív tanulás végrehajtására egy fizikai állapot jelenlétében, a tudásgradiens fogalmának felhasználásával.
⬤ Az értékfüggvények közelítésének statisztikai módszereit, egy rögzített politika értékének becslését és az értékfüggvények közelítését az optimális politikák keresése során leíró új fejezetek sorozata.
Az ADP bemutatott lefedettsége a modellekre és algoritmusokra helyezi a hangsúlyt, a kapcsolódó alkalmazásokra és számításokra összpontosítva, miközben a téma elméleti oldalát is tárgyalja, amely a konvergencia bizonyítását és a konvergenciarátát vizsgálja. A kapcsolódó weboldalon a közelítő dinamikus programozás és a megerősítéses tanulás fejlődő területeinek folyamatos megvitatására kerül sor, további olvasmányokkal, szoftverekkel és adatkészletekkel együtt.
A csak alapvető statisztikai és valószínűségi ismereteket igénylő Approximate Dynamic Programming, Second Edition kiváló könyv az ipari mérnöki és operációkutatási kurzusokhoz felsőfokú és egyetemi szintű hallgatók számára. Emellett értékes referenciaként szolgál azon kutatók és szakemberek számára is, akik a dinamikus programozást, a sztochasztikus programozást és az irányításelméletet használják mindennapi munkájuk során felmerülő problémák megoldására.