Értékelés:
Jelenleg nincsenek olvasói vélemények. Az értékelés 12 olvasói szavazat alapján történt.
Reinforcement Learning Algorithms with Python
Öntanuló algoritmusok és ágensek fejlesztése a TensorFlow és más Python eszközök, keretrendszerek és könyvtárak használatával Főbb jellemzők Fejlett megerősítéses tanulási algoritmusok megtanulása, fejlesztése és alkalmazása különböző feladatok megoldására Modellmentes és modellalapú algoritmusok megértése és fejlesztése öntanuló ágensek építéséhez Fejlett megerősítéses tanulási koncepciókkal és algoritmusokkal, például utánzásos tanulással és evolúciós stratégiákkal dolgozik Könyv leírása
A megerősítéses tanulás (Reinforcement Learning, RL) a mesterséges intelligencia egyik népszerű és ígéretes ága, amely olyan intelligensebb modellek és ágensek készítésével foglalkozik, amelyek a változó követelmények alapján automatikusan képesek meghatározni az ideális viselkedést. Ez a könyv segít elsajátítani az RL-algoritmusokat és megérteni azok megvalósítását, miközben önképző ágenseket épít.
A könyv az RL-környezetben való munkához szükséges eszközök, könyvtárak és beállítások bemutatásával kezdődik, majd az RL építőelemeit tárgyalja, és az értékalapú módszerekkel, például a Q-tanulás és a SARSA algoritmusok alkalmazásával foglalkozik. Megtanulja, hogyan használhatja a Q-tanulás és a neurális hálózatok kombinációját komplex problémák megoldására. Továbbá tanulmányozza a teljesítmény és stabilitás javítása érdekében a policy gradiens módszereket, a TRPO-t és a PPO-t, mielőtt áttérne a DDPG és a TD3 determinisztikus algoritmusokra. A könyv kitér arra is, hogyan működnek az utánzásos tanulási technikák, és hogyan taníthat meg a Dagger egy ügynököt vezetni. Felfedezi az evolúciós stratégiákat és a fekete dobozos optimalizálási technikákat, és megnézi, hogyan javíthatják az RL algoritmusokat. Végül megismerkedik az olyan feltáró megközelítésekkel, mint az UCB és az UCB1, és kifejleszt egy meta-algoritmust, az ESBAS-t.
A könyv végére Ön már a legfontosabb RL-algoritmusokkal dolgozhat, hogy valós alkalmazásokban jelentkező kihívásokat oldjon meg, és az RL-kutatók közösségének részévé váljon. Amit tanulni fogsz Egy CartPole játékot játszó ágens kifejlesztése az OpenAI Gym interfész segítségével Fedezd fel a modellalapú megerősítéses tanulás paradigmáját Oldd meg a Frozen Lake problémát dinamikus programozással Fedezd fel a Q-tanulást és a SARSA-t egy taxis játékra való tekintettel Alkalmazd a Deep Q-Networks (DQN) algoritmusokat az Atari játékokra a Gym segítségével Tanulmányozd a policy gradiens algoritmusokat, beleértve az Actor-Critic-et és a REINFORCE-t. Értse és alkalmazza a PPO-t és a TRPO-t folyamatos mozgáskörnyezetben Megismerkedjen a Holdra szállás problémájának megoldására szolgáló evolúciós stratégiákkal.
Ha Ön mesterséges intelligencia kutató, mélytanulás-felhasználó, vagy bárki, aki a semmiből szeretné megtanulni a megerősítéses tanulást, ez a könyv Önnek szól. Akkor is hasznos lesz ez a megerősítéses tanulásról szóló könyv, ha meg akarja ismerni a terület fejlődését. Python nyelvtudás szükséges. Tartalomjegyzék Az erősítéses tanulás tájai Az RL-ciklus és az OpenAI Gym megvalósítása Problémák megoldása dinamikus programozással Q-tanulás és SARSA alkalmazások Mély Q-hálózati tanulás sztochasztikus és DDPG optimalizálás TRPO és PPO megvalósítás DDPG és TD3 alkalmazások Modellalapú RL utánzásos tanulás a DAgger algoritmussal Black-Box optimalizációs algoritmusok megértése Az ESBAS algoritmus fejlesztése Gyakorlati megvalósítás az RL kihívások megoldására.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)