Értékelés:
Jelenleg nincsenek olvasói vélemények. Az értékelés 9 olvasói szavazat alapján történt.
Pandas for Everyone: Python Data Analysis
A gyakorlatias, példákban gazdag bevezetés a Pandas adatelemzésbe Pythonban
Napjainkban az elemzőknek rendkívüli változatossággal, sebességgel és mennyiséggel jellemezhető adatokat kell kezelniük. A nyílt forráskódú Pandas könyvtár segítségével a Python segítségével gyorsan automatizálható és elvégezhető gyakorlatilag bármilyen adatelemzési feladat, függetlenül attól, hogy milyen nagy vagy összetett. A Pandas segítségével biztosíthatja adatai valódiságát, vizualizálhatja azokat a hatékony döntéshozatal érdekében, és megbízhatóan reprodukálhatja az elemzéseket több adathalmazon keresztül.
A Pandas for Everyone gyakorlati ismereteket és betekintést nyújt a Pandas segítségével valódi problémák megoldásához, még akkor is, ha még nem ismeri a Python adatelemzést. Daniel Y. Chen egyszerű, de gyakorlatias példákon keresztül mutatja be a kulcsfogalmakat, fokozatosan építve rájuk a nehezebb, valós problémák megoldása érdekében.
Chen egy reális adatkészlettel indítja el a Pandas használatát, és kitér az adatkészletek kombinálására, a hiányzó adatok kezelésére, valamint az adatkészletek strukturálására a könnyebb elemzés és vizualizáció érdekében. Bemutatja az erőteljes adattisztítási technikákat, az alapvető karakterlánc-manipulációtól kezdve a függvények adatkereteken keresztüli egyidejű alkalmazásáig.
Ha az adatok készen állnak, Chen végigvezeti Önt az előrejelzéshez, klaszterezéshez, következtetéshez és feltáráshoz szükséges modellek illesztésén. Tippeket ad a teljesítményre és a skálázhatóságra vonatkozóan, és bemutatja a Python szélesebb körű adatelemzési ökoszisztémáját.
⬤ Munka DataFrame-ekkel és sorozatokkal, valamint adatok importálása vagy exportálásaDiagramok készítése matplotlib, seaborn és pandas segítségével.
⬤ Adatkészletek kombinálása és hiányzó adatok kezelése.
⬤ Megformázza, rendbe teszi és megtisztítja az adathalmazokat, hogy könnyebb legyen velük dolgozni.
⬤ Adattípusok átalakítása és szöveges karakterláncok kezelése.
⬤ Függvények alkalmazása az adatmanipulációk skálázásához.
⬤ Groupby segítségével nagy adathalmazok összevonása, átalakítása és szűrése.
⬤ Használja a Pandas fejlett dátum és idő képességeit.
⬤ Lineráris modellek illesztése a statsmodels és a scikit-learn könyvtárak használatával.
⬤ Használja az általánosított lineáris modellezést különböző válaszváltozókkal rendelkező modellek illesztésére.
⬤ Egymás modellek összehasonlítása a legjobb kiválasztásához.
⬤ Regularizálás a túlillesztés leküzdésére és a teljesítmény javítására.
⬤ Klaszterezés használata a felügyelet nélküli gépi tanulásban.
⬤ .
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)