Értékelés:

Jelenleg nincsenek olvasói vélemények. Az értékelés 2 olvasói szavazat alapján történt.
Learning-Based Control: A Tutorial and Some Recent Results
A megerősítéses tanulás és a kapcsolódó módszerek közelmúltbeli sikere több kulcsfontosságú tényezőnek tulajdonítható. Először is, a környezettel való interakció révén kapott jutalomjelek vezérlik. Másodszor, szorosan kapcsolódik az emberi tanulási viselkedéshez. Harmadszor, szilárd matematikai alapokon nyugszik. Mindazonáltal a hagyományos megerősítő tanulás elmélete néhány hiányosságot mutat, különösen folyamatos környezetben vagy a szabályozott folyamat stabilitásának és robusztusságának figyelembevételével.
Ebben a monográfiában a szerzők a megerősítéses tanulásra építve bemutatnak egy tanulási alapú megközelítést a dinamikus rendszerek valós idejű adatokból történő vezérlésére, és áttekintik e viszonylag fiatal terület néhány fontosabb fejlesztését. Ennek során a szerzők kidolgoznak egy keretrendszert a tanulásalapú irányításelmélethez, amely megmutatja, hogyan lehet közvetlenül szuboptimális szabályozókat tanulni a bemeneti-kimeneti adatokból.
A tanulásalapú irányítás fejlesztésének három fő kihívása van. Először is, szükség van a meglévő rekurzív módszerek általánosítására. Másodszor, a tanulásalapú vezérlés és a megerősítésen alapuló tanulás közötti alapvető különbségként a stabilitás és a robusztusság fontos kérdések, amelyeket a biztonságkritikus műszaki rendszerek, például az önvezető autók esetében kell kezelni. Harmadszor, a biztonságkritikus mérnöki rendszerek esetében foglalkozni kell a megerősítő tanulási algoritmusok adathatékonyságával.
Ez a monográfia az olvasó számára hozzáférhető alapozót nyújt az irányításelmélet egy új, még gyerekcipőben járó irányzatáról, nevezetesen Tanulásalapú irányításelmélet, amely szorosan kapcsolódik a biztonságos megerősítéses tanulás és az adaptív dinamikus programozás irodalmához.