Értékelés:
A könyv egy nagyra értékelt gyakorlati útmutató a mély megerősítéses tanulásról, amely az elméletet gyakorlati kódpéldákkal vegyíti. Sok olvasó értékeli a könyv áttekinthetőségét, szervezettségét, valamint a szerző képességét, hogy komplex fogalmakat is közérthetővé tesz. Néhány kritika azonban megemlíti az elméleti magyarázatok mélységének hiányát és néhány pontatlanságot a definíciókban.
Előnyök:⬤ Könnyen hozzáférhető és jól megírt, a kezdők és a témában előismeretekkel rendelkezők számára egyaránt alkalmas.
⬤ Részletes kódpéldák, amelyek elősegítik a fogalmak megértését.
⬤ Nagyszerű gyakorlati alkalmazás a legújabb könyvtárakkal és technikákkal.
⬤ Világos magyarázatot ad az elméleti fogalmakra.
⬤ Kifejezetten ajánlott mindenkinek, akit érdekel a megerősített tanulás.
⬤ Néhány olvasó pontatlanságokat jegyez meg, például a tenzorok definícióját illetően.
⬤ Nem elég mély a matematikai elméletben azok számára, akik mélyreható előadásokat keresnek.
⬤ Bizonyos fogalmak teljes megértéséhez további forrásokra van szükség.
⬤ Néhány példa zavart okozhat, és további kutatást tesz szükségessé.
(44 olvasói vélemény alapján)
Deep Reinforcement Learning Hands-On: Apply modern RL methods, with deep Q-networks, value iteration, policy gradients, TRPO, AlphaGo Zero and more
A kiadó megjegyzése: Ez a 2018-as kiadás elavult, és nem kompatibilis a Python könyvtárak legújabb frissítéseivel. A 2020-ra frissített új, harmadik kiadás hat új fejezettel bővült, amelyek között szerepelnek a több ágensre épülő módszerek, a diszkrét optimalizálás, az RL a robotikában és a fejlett feltárási technikák.
Ez a gyakorlati útmutató megtanítja, hogyan használható a mélytanulás (DL) komplex valós problémák megoldására.
Főbb jellemzők
⬤ Tárja fel a mély megerősítéses tanulást (RL), az első alapelvektől a legújabb algoritmusokig.
⬤ Értelmezze a magas szintű RL módszereket, beleértve az értékiterációt, a mély Q-hálózatokat, a policy gradients, a TRPO, PPO, DDPG, D4PG, az evolúciós stratégiákat és a genetikai algoritmusokat.
⬤ Tartson lépést a legfrissebb iparági fejlesztésekkel, beleértve a mesterséges intelligencia által vezérelt chatbotokat.
Könyvismertető
A Deep Reinforcement Learning Hands-On egy átfogó útmutató a legmodernebb DL-eszközökről és azok korlátairól. Értékelni fogja a módszereket, köztük a kereszt-entrópiát és a policy gradientset, mielőtt valós környezetben alkalmazza őket. Vállalja az Atari virtuális játékkészletét és az olyan családi kedvenceket, mint a Connect4.
A könyv bevezetést nyújt az RL alapjaiba, és megadja a know-how-t az intelligens tanuló ágensek kódolásához, hogy a gyakorlati feladatok széles skálájával foglalkozhasson. Fedezze fel, hogyan valósíthatja meg a Q-tanulást "rácsvilági" környezetekben, tanítsa meg az ügynököt részvények vásárlására és kereskedésére, és tudja meg, hogy a természetes nyelvi modellek hogyan mozgatják a chatbotok fellendülését.
Mit fogsz tanulni?
⬤ Az RL DL kontextusának megértése és komplex DL modellek implementálása.
⬤ Tanulja meg az RL alapjait: Markov döntési folyamatok.
⬤ Értelmezze az RL módszereket, beleértve a Cross-entropy, DQN, Actor-Critic, TRPO, PPO, DDPG, D4PG és másokat.
⬤ Találja meg, hogyan kezelhet diszkrét és folytonos akciótereket különböző környezetekben.
⬤ Döntse le az Atari arcade játékokat az értékiterációs módszerrel.
⬤ Hozzon létre saját OpenAI Gym környezetet egy tőzsdei kereskedési ügynök kiképzéséhez.
⬤ Tanítsd meg az ügynöködet Connect4-et játszani az AlphaGo Zero segítségével.
⬤ Felfedezze a legfrissebb mély RL kutatásokat olyan témákban, mint a mesterséges intelligencia által vezérelt chatbotok.
Kinek szól ez a könyv
Némi folyékony Python nyelvtudást feltételezünk. Az alapvető mélytanulási (DL) megközelítéseknek ismerősnek kell lenniük az olvasók számára, és hasznos lesz némi gyakorlati tapasztalat a DL-ben. Ez a könyv bevezetés a mély megerősítő tanulásba (RL), és nem igényel RL előképzettséget.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)