Erősítéses tanulási algoritmusok Pythonnal

Erősítéses tanulási algoritmusok Python nyelvvel (Andrea Lonza)

Olvasói vélemények

Jelenleg nincsenek olvasói vélemények. Az értékelés 12 olvasói szavazat alapján történt.

Eredeti címe:

Reinforcement Learning Algorithms with Python

Könyv tartalma:

Öntanuló algoritmusok és ágensek fejlesztése a TensorFlow és más Python eszközök, keretrendszerek és könyvtárak használatával Főbb jellemzők Fejlett megerősítéses tanulási algoritmusok megtanulása, fejlesztése és alkalmazása különböző feladatok megoldására Modellmentes és modellalapú algoritmusok megértése és fejlesztése öntanuló ágensek építéséhez Fejlett megerősítéses tanulási koncepciókkal és algoritmusokkal, például utánzásos tanulással és evolúciós stratégiákkal dolgozik Könyv leírása

A megerősítéses tanulás (Reinforcement Learning, RL) a mesterséges intelligencia egyik népszerű és ígéretes ága, amely olyan intelligensebb modellek és ágensek készítésével foglalkozik, amelyek a változó követelmények alapján automatikusan képesek meghatározni az ideális viselkedést. Ez a könyv segít elsajátítani az RL-algoritmusokat és megérteni azok megvalósítását, miközben önképző ágenseket épít.

A könyv az RL-környezetben való munkához szükséges eszközök, könyvtárak és beállítások bemutatásával kezdődik, majd az RL építőelemeit tárgyalja, és az értékalapú módszerekkel, például a Q-tanulás és a SARSA algoritmusok alkalmazásával foglalkozik. Megtanulja, hogyan használhatja a Q-tanulás és a neurális hálózatok kombinációját komplex problémák megoldására. Továbbá tanulmányozza a teljesítmény és stabilitás javítása érdekében a policy gradiens módszereket, a TRPO-t és a PPO-t, mielőtt áttérne a DDPG és a TD3 determinisztikus algoritmusokra. A könyv kitér arra is, hogyan működnek az utánzásos tanulási technikák, és hogyan taníthat meg a Dagger egy ügynököt vezetni. Felfedezi az evolúciós stratégiákat és a fekete dobozos optimalizálási technikákat, és megnézi, hogyan javíthatják az RL algoritmusokat. Végül megismerkedik az olyan feltáró megközelítésekkel, mint az UCB és az UCB1, és kifejleszt egy meta-algoritmust, az ESBAS-t.

A könyv végére Ön már a legfontosabb RL-algoritmusokkal dolgozhat, hogy valós alkalmazásokban jelentkező kihívásokat oldjon meg, és az RL-kutatók közösségének részévé váljon. Amit tanulni fogsz Egy CartPole játékot játszó ágens kifejlesztése az OpenAI Gym interfész segítségével Fedezd fel a modellalapú megerősítéses tanulás paradigmáját Oldd meg a Frozen Lake problémát dinamikus programozással Fedezd fel a Q-tanulást és a SARSA-t egy taxis játékra való tekintettel Alkalmazd a Deep Q-Networks (DQN) algoritmusokat az Atari játékokra a Gym segítségével Tanulmányozd a policy gradiens algoritmusokat, beleértve az Actor-Critic-et és a REINFORCE-t. Értse és alkalmazza a PPO-t és a TRPO-t folyamatos mozgáskörnyezetben Megismerkedjen a Holdra szállás problémájának megoldására szolgáló evolúciós stratégiákkal.

Ha Ön mesterséges intelligencia kutató, mélytanulás-felhasználó, vagy bárki, aki a semmiből szeretné megtanulni a megerősítéses tanulást, ez a könyv Önnek szól. Akkor is hasznos lesz ez a megerősítéses tanulásról szóló könyv, ha meg akarja ismerni a terület fejlődését. Python nyelvtudás szükséges. Tartalomjegyzék Az erősítéses tanulás tájai Az RL-ciklus és az OpenAI Gym megvalósítása Problémák megoldása dinamikus programozással Q-tanulás és SARSA alkalmazások Mély Q-hálózati tanulás sztochasztikus és DDPG optimalizálás TRPO és PPO megvalósítás DDPG és TD3 alkalmazások Modellalapú RL utánzásos tanulás a DAgger algoritmussal Black-Box optimalizációs algoritmusok megértése Az ESBAS algoritmus fejlesztése Gyakorlati megvalósítás az RL kihívások megoldására.

A könyv egyéb adatai:

ISBN:	9781789131116
Szerző:	Andrea Lonza
Kiadó:	Packt Pub
Nyelv:	angol
Kötés:	Puha kötés

Vásárlás:

Jelenleg kapható, készleten van.

Erősítéses tanulási algoritmusok Python nyelvvel

Olvasói vélemények

Eredeti címe:

Könyv tartalma:

A könyv egyéb adatai:

Vásárlás:

A szerző további könyvei:

A szerző munkáit az alábbi kiadók adták ki: