Értékelés:
A „Deep Reinforcement Learning with Python” második kiadását széles körben dicsérik a világosságáért, a megerősítéses tanulás fogalmainak átfogó lefedettségéért és a TensorFlow 2.0 és az OpenAI Gym segítségével történő gyakorlatias, gyakorlatias kódolási példákért. Néhány olvasó azonban elavultnak találja a szoftverfüggőségek tekintetében, és frusztrálónak a fogalmak magyarázatának hiánya miatt bizonyos példákban.
Előnyök:⬤ Világos magyarázatok és a fogalmak fokozatos áramlása az alapszintű RL-témáktól a haladó RL-témákig.
⬤ Gyakorlati gyakorlatok a TensorFlow
⬤ 0 és az OpenAI Gym segítségével, amelyek támogatják a gyakorlati tanulást.
⬤ A megerősítéses tanulási algoritmusok széles körének nagyon részletes és átfogó lefedése.
⬤ Vizuális illusztrációk segítik a megértést.
⬤ Jelentős javulás az első kiadáshoz képest, beleértve a részletes matematikai magyarázatokat.
⬤ Néhány tartalom elavultnak tűnhet, különösen a TensorFlow
⬤ x-re való támaszkodás miatt bizonyos példák esetében.
⬤ Egyes példáknál hiányoznak a részletes magyarázatok, ami zavart okoz az egyes döntések mögött meghúzódó indoklással kapcsolatban.
⬤ A könyv terjedelme (700 oldal), amit egyes olvasók túlterhelőnek találnak, és javasolhatják a könyv felosztását kezdő és haladó verzióra.
⬤ A kódkörnyezetre vonatkozó telepítési utasításokat egyes felhasználók elégtelennek tartják.
(21 olvasói vélemény alapján)
Deep Reinforcement Learning with Python - Second Edition
Egy példákban gazdag útmutató kezdőknek, hogy elkezdhessék a megerősítéses és mély megerősítéses tanulás útját a legmodernebb algoritmusokkal
Főbb jellemzők
⬤ Az alapszintű és a haladó RL algoritmusok széles spektrumát fedi le, az egyes algoritmusok matematikai magyarázataival.
⬤ Tanulja meg, hogyan kell az algoritmusokat kóddal megvalósítani a soronkénti magyarázatokkal ellátott példák követésével.
⬤ Felfedezi a legújabb RL-módszereket, mint például a DDPG, a PPO és a szakértői demonstrációk használata.
Könyvismertető
Mivel az algoritmusok minősége és mennyisége az elmúlt években jelentősen javult, a Hands-On Reinforcement Learning with Python második kiadása egy példákban gazdag útmutatóvá vált a legmodernebb megerősítéses tanulás (RL) és mély RL algoritmusok elsajátításához a TensorFlow 2 és az OpenAI Gym eszközkészlet segítségével.
Az RL alapjai és az olyan alapfogalmak, mint a Bellman-egyenlet, a Markov-döntési folyamatok és a dinamikus programozási algoritmusok feltárása mellett ez a második kiadás az értékalapú, politikaalapú és szereplő-kritikus RL-módszerek teljes spektrumába is belemerül. Alaposan feltárja a legmodernebb algoritmusokat, mint például a DQN, TRPO, PPO és ACKTR, DDPG, TD3 és SAC, demisztifikálva a mögöttes matematikát és egyszerű kódpéldákon keresztül bemutatva a megvalósításokat.
A könyv több új fejezetet szentel az új RL-technikáknak, köztük a disztribúciós RL-nek, az imitációs tanulásnak, az inverz RL-nek és a meta RL-nek. Megtanulhatja, hogyan használhatja ki a stabil alapvonalakat, az OpenAI alapvonal-könyvtárának továbbfejlesztését, hogy könnyedén megvalósíthassa a népszerű RL-algoritmusokat. A könyv az olyan ígéretes megközelítések áttekintésével zárul, mint a meta-tanulás és a képzelettel kiegészített ágensek a kutatásban.
A könyv végére képessé válik az RL és a mély RL hatékony alkalmazására valós projektjeiben.
Amit tanulni fog
⬤ Az RL alapfogalmainak megértése, beleértve a módszertanokat, a matematikát és a kódot.
⬤ Tanítson meg egy ügynököt a Blackjack, FrozenLake és sok más probléma megoldására az OpenAI Gym segítségével.
⬤ Tréningezz egy ágenst Ms Pac-Man játékra egy Deep Q Network segítségével.
⬤ Tanulja meg a politika-alapú, érték-alapú és szereplő-kritikai módszereket.
⬤ Mestereld meg a DDPG, TD3, TRPO, PPO és sok más módszer mögött álló matematikát.
⬤ Felfedezzen olyan új utakat, mint az elosztási RL, a meta RL és az inverz RL.
⬤ A stabil alapvonalak használata egy ügynök járásra és Atari játékokra való betanítására.
Kinek szól ez a könyv
Ha Ön gépi tanulással foglalkozó fejlesztő, aki kevés vagy semmilyen tapasztalattal nem rendelkezik a neurális hálózatokkal kapcsolatban, és érdeklődik a mesterséges intelligencia iránt, és szeretné az alapoktól megismerni a megerősítéses tanulást, akkor ez a könyv Önnek szól.
Alapvető ismeretekre van szükség a lineáris algebrában, a számtanban és a Python programozási nyelvben. A TensorFlow-val kapcsolatos némi tapasztalat előny lenne.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)