Értékelés:
Jelenleg nincsenek olvasói vélemények. Az értékelés 12 olvasói szavazat alapján történt.
Deep Reinforcement Learning with Python: With Pytorch, Tensorflow and Openai Gym
A mély megerősítéses tanulás gyorsan növekvő tudományág, amely jelentős hatást gyakorol az autonóm járművek, a robotika, az egészségügy, a pénzügy és még sok más területen. Ez a könyv a mély megerősítéses tanulást a deep-q learning és a policy gradiens modellek segítségével, kódolási gyakorlattal tárgyalja.
Először is áttekintjük a Markov-döntési folyamatokat, a Bellman-egyenleteket és a dinamikus programozást, amelyek a mély megerősítéses tanulás alapfogalmait és alapjait képezik. Ezután a modellmentes tanulást tanulmányozza, amelyet a neurális hálózatokkal és a mélytanulással történő függvényközelítés követ. Ezt követik a különböző mély megerősítéses tanulási algoritmusok, például a mély q-hálózatok, a szereplő-kritikus módszerek különböző ízű változatai és más irányelv-alapú módszerek.
Megnézzük továbbá a felfedezés vs. kihasználás dilemmát, amely a megerősített tanulási algoritmusok egyik legfontosabb szempontja, valamint a Monte Carlo fakeresést (MCTS), amely kulcsszerepet játszott az AlphaGo sikerében. Az utolsó fejezetek a mély megerősítéses tanulás megvalósításával zárulnak, olyan népszerű mélytanulási keretrendszerek használatával, mint a TensorFlow és a PyTorch. A végén megérti a mély megerősítéses tanulást a mély q-hálózatokkal és a policy gradiens modellek implementálásával együtt a TensorFlow, a PyTorch és az Open AI Gym segítségével.
Mit fogsz tanulni
⬤ Vizsgálja meg a mély megerősítő tanulást.
⬤ Mély tanulási algoritmusok implementálása az OpenAI Gym környezetének használatával.
⬤ Kódolj saját játékot játszó ágenseket az Atari számára színészkritikus algoritmusok segítségével.
⬤ A modellépítés és az algoritmusok képzésének legjobb gyakorlatainak alkalmazása.
Kinek szól ez a könyv
Gépi tanulási fejlesztők és építészek, akik a mesterséges intelligencia és a mélytanulás területén szeretnének az élen járni.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)