Értékelés:
A könyvet széles körben a megerősítéses tanulás (RL) szerelmesei és szakemberei számára alapvető forrásként tartják számon. Dicsérik mélysége, áttekinthetősége, jól felépített gyakorlatai és pedagógiai megközelítése miatt, ami még a közepes matematikai háttérrel rendelkezők számára is hozzáférhetővé teszi. A kritikák középpontjában azonban a következetlen nyomtatási minőség áll, különösen a nem közvetlenül az MIT Press-től származó kiadások esetében, valamint a terület teljesen kezdők számára való alkalmasságával kapcsolatos aggályok.
Előnyök:⬤ A megerősített tanulás átfogó lefedése
⬤ jól strukturált és szigorú gyakorlatok
⬤ világos magyarázatok
⬤ jó nyomtatási minőség a közvetlenül az MIT Press által forgalmazott példányokban
⬤ különböző szintű szakértelemmel rendelkezők számára is hasznos (különösen azok számára, akik már rendelkeznek némi előismerettel)
⬤ interdiszciplináris kapcsolatokat tartalmaz a pszichológiával és az idegtudományokkal.
⬤ Nem egyenletes nyomtatási minőség, különösen a harmadik féltől származó példányoknál
⬤ nem alkalmas bevezető szövegnek teljesen kezdők számára
⬤ egyes szakaszok matematikailag intenzívek
⬤ a történelmi tartalmakat egyes olvasók feleslegesnek tarthatják
⬤ kisebb szerkesztési hibákról számoltak be egyes példányokban.
(115 olvasói vélemény alapján)
Reinforcement Learning, Second Edition: An Introduction
A mesterséges intelligencia egyik legaktívabb kutatási területének, a megerősítéses tanulásnak a széles körben használt, jelentősen bővített és frissített új kiadása.
A megerősítéses tanulás, a mesterséges intelligencia egyik legaktívabb kutatási területe, a tanulás olyan számítási megközelítése, amelynek során egy ágens megpróbálja maximalizálni a kapott jutalom teljes összegét, miközben egy komplex, bizonytalan környezettel interakcióba lép. A megerősítéses tanulás című könyvben Richard Sutton és Andrew Barto világosan és egyszerűen ismerteti a terület legfontosabb ötleteit és algoritmusait. Ez a második kiadás jelentősen kibővült és frissült, új témákat mutat be, és frissíti más témák lefedettségét.
Az első kiadáshoz hasonlóan ez a második kiadás is az alapvető online tanulási algoritmusokra összpontosít, a matematikai anyagot pedig árnyékolt dobozokba helyezve. Az I. rész a megerősített tanulás minél nagyobb részét lefedi anélkül, hogy túlmutatna a táblázatos eseten, amelyre pontos megoldások találhatók. Számos, ebben a részben bemutatott algoritmus újdonság a második kiadásban, köztük az UCB, a Várható Sarsa és a Dupla tanulás. A II. rész kiterjeszti ezeket az elképzeléseket a függvények közelítésére, olyan új fejezetekkel, mint a mesterséges neurális hálózatok és a Fourier-alap, és bővített kezelést kínál a politikán kívüli tanulás és a politika-gradiens módszerek számára. A III. rész új fejezeteket tartalmaz a megerősítéses tanulásnak a pszichológiával és az idegtudományokkal való kapcsolatáról, valamint egy frissített esettanulmány-fejezetet, beleértve az AlphaGo és az AlphaGo Zero, az Atari-játékok és az IBM Watson fogadási stratégiáját. Az utolsó fejezet a megerősítéses tanulás jövőbeli társadalmi hatásait tárgyalja.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)