Értékelés:
A könyv a megerősítéses tanulás tudományos ismereteinek és gyakorlati alkalmazásainak kombinációját kínálja. Ugyanakkor súlyos elgépelésekkel, nem megfelelő nyomtatási minőséggel és a célközönséget illetően nem egyértelmű. Sok kritikus úgy találta, hogy a kezdők számára túlságosan tudományos jellegű, és nem eléggé gyakorlatias az ipari alkalmazáshoz.
Előnyök:Nagyszerű keveréke az akadémiai és az ipari ismereteknek, hasznos meglátások a gyakorlati felhasználási esetekhez, a kézbesítéskor jól fogadott állapot.
Hátrányok:Súlyos elgépelések a központi egyenletekben, nem megfelelő fekete-fehér nyomtatási minőség, nem egyértelmű a célközönség, nem elég világos és gyakorlatias, kezdők számára túlságosan akadémikus.
(5 olvasói vélemény alapján)
Reinforcement Learning: Industrial Applications of Intelligent Agents
A megerősítő tanulás (RL) a következő évtizedben az egyik legnagyobb áttörést fogja hozni a mesterséges intelligenciában, lehetővé téve az algoritmusok számára, hogy a környezetükből tanulva tetszőleges célokat érjenek el. Ez az izgalmas fejlesztés kiküszöböli a hagyományos gépi tanulási (ML) algoritmusokban található korlátozásokat. Ez a gyakorlatias könyv megmutatja az adattudomány és a mesterséges intelligencia szakembereinek, hogyan lehet megerősítéssel tanulni, és lehetővé tenni, hogy egy gép magától tanuljon.
A szerző, Phil Winder, a Winder Research munkatársa az alapvető építőelemektől a legkorszerűbb gyakorlatokig mindent tárgyal. Felfedezi az RL jelenlegi helyzetét, az ipari alkalmazásokra összpontosít, számos algoritmust megismerhet, és profitálhat az RL-megoldások termelésbe való bevezetéséről szóló dedikált fejezetekből. Ez nem szakácskönyv; nem riad vissza a matematikától, és elvárja az ML ismeretét.
⬤ Tanulja meg, mi az RL, és hogyan segítik az algoritmusok a problémák megoldását.
⬤ Megalapozza az RL alapjait, beleértve a Markov-döntési folyamatokat, a dinamikus programozást és az időbeli különbségek tanulását.
⬤ Mélyüljön el az érték- és irányelv-gradiens módszerek széles skálájában.
⬤ Alkalmazza az olyan fejlett RL megoldásokat, mint a meta-tanulás, a hierarchikus tanulás, a több ágenses és az imitációs tanulás.
⬤ Tanulja meg a legmodernebb mély RL algoritmusokat, beleértve a Rainbow, PPO, TD3, SAC és más algoritmusokat.
⬤ Tegyen szert gyakorlati példákra a kísérő weboldalon keresztül.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)