Értékelés:

A könyv átfogó útmutató a kiegyensúlyozatlan adathalmazok által a gépi tanulásban jelentett kihívások kezeléséhez. Az elméleti koncepciókat gyakorlati alkalmazásokkal ötvözi, különböző módszereket, mintavételi technikákat, értékelési metrikákat és valós meglátásokat kínál, amelyek mind a gyakorlati szakemberek, mind a tanulók számára értékesek.
Előnyök:A könyv éleslátó, gyakorlatias és könnyen érthető, széleskörűen tárgyalja a mintavételi módszereket, a költségérzékeny tanulást, a modellkalibrációt és az értékelési metrikákat. Részletes példákat tartalmaz kóddal, grafikus illusztrációkkal és olyan magával ragadó tartalommal, mint a rajzfilmek. Emellett gyakorlati tapasztalatokat is nyújt a GitHub notebookokon keresztül, így értékes forrást jelent a kiegyensúlyozatlan adatokkal foglalkozók számára.
Hátrányok:Egyes olvasók úgy találhatják, hogy a könyv inkább a gépi tanulással kapcsolatos előzetes ismeretekkel rendelkező egyéneknek szól, és nem minden fejlett technikát fed le kimerítően. Bizonyos fogalmak teljes megértéséhez még további tanulmányokra vagy külső forrásokra lehet szükség.
(10 olvasói vélemény alapján)
Machine Learning for Imbalanced Data: Tackle imbalanced datasets using machine learning and deep learning techniques
Emelje a gépi tanulással kapcsolatos ismereteit a következő szintre ezzel az alapvető útmutatóval, amely olyan könyvtárakat használ, mint az imbalanced-learn, PyTorch, scikit-learn, pandas és NumPy, hogy maximalizálja a modell teljesítményét és kezelje a kiegyensúlyozatlan adatokat
Key Features:
⬤ Tanulja meg, hogyan használja a modern gépi tanulási keretrendszereket részletes magyarázatok, illusztrációk és kódminták segítségével.
⬤ Tanulja meg a legmodernebb mélytanulási technikákat az adatok kiegyensúlyozatlanságának leküzdésére.
⬤ Tárja fel a különböző módszereket a ferde adatok kezelésére az ML és DL alkalmazásokban.
⬤ A nyomtatott vagy Kindle könyv megvásárlása egy ingyenes e-könyvet tartalmaz PDF formátumban.
A könyv leírása:
A gépi tanulás gyakorló szakembereiként gyakran találkozunk kiegyensúlyozatlan adathalmazokkal, amelyekben az egyik osztály lényegesen kevesebb példányt tartalmaz, mint a másik. Sok gépi tanulási algoritmus feltételezi a többségi és kisebbségi osztályok közötti egyensúlyt, ami kiegyensúlyozatlan adatokon szuboptimális teljesítményhez vezet. Ez az átfogó útmutató segít kezelni ezt az osztályegyensúlytalanságot, hogy jelentősen javítsa a modellek teljesítményét.
A Machine Learning for Imbalanced Data (Gépi tanulás kiegyensúlyozatlan adatokhoz) című könyv azzal kezdődik, hogy bemutatja a kiegyensúlyozatlan adathalmazok által támasztott kihívásokat és az ezek kezelésének fontosságát. Ezután végigvezeti Önt azokon a technikákon, amelyek növelik a klasszikus gépi tanulási modellek teljesítményét kiegyensúlyozatlan adatok használata esetén, beleértve a különböző mintavételi és költségérzékeny tanulási módszereket.
A tananyag előrehaladtával a mélytanulási modellek hasonló és fejlettebb technikáiba mélyül el, a PyTorch-ot elsődleges keretrendszerként alkalmazva. A könyvben gyakorlati példák segítségével működő és reprodukálható kódot találsz, amely bemutatja az egyes technikák gyakorlati megvalósítását.
A könyv végére ügyes lesz az osztályok egyensúlytalanságának azonosításában és kezelésében, valamint a különböző technikák, köztük a mintavételezés, a költségérzékeny technikák és a küszöbértékek beállításának magabiztos alkalmazásában, miközben hagyományos gépi tanulási vagy mélytanulási modelleket használ.
Amit tanulni fog:
⬤ A kiegyensúlyozatlan adatok hatékony felhasználása a gépi tanulási modellekben.
⬤ Tárja fel az osztályok kiegyensúlyozatlansága esetén használt metrikákat.
⬤ Megtanulja, hogyan és mikor alkalmazzon különböző mintavételi módszereket, mint például a túlmintavételezés és az alulmintavételezés.
⬤ Adat alapú, algoritmus alapú és hibrid megközelítések alkalmazása az osztályok kiegyensúlyozatlanságának kezelésére.
⬤ Az adatok kiegyensúlyozásának különböző lehetőségeinek kombinálása és kiválasztása a gyakori buktatók elkerülése mellett.
⬤ A modellkalibráció és a küszöbérték-beállítás fogalmának megértése a kiegyensúlyozatlan adathalmazok kezelésével összefüggésben.
Kinek szól ez a könyv:
Ez a könyv azoknak a gépi tanulással foglalkozó szakembereknek szól, akik hatékonyan szeretnék kezelni a kiegyensúlyozatlan adathalmazok kihívásait projektjeikben. Adattudósok, gépi tanulással foglalkozó mérnökök/tudósok, kutató tudósok/mérnökök és adattudósok/mérnökök hasznosnak találják ezt a könyvet. Bár teljesen kezdők is szívesen olvassák ezt a könyvet, a gépi tanulás alapvető fogalmainak némi ismerete segít az olvasóknak abban, hogy maximalizálják az ebből az átfogó forrásból származó előnyöket és meglátásokat.