Értékelés:
A könyv bevezetésként szolgál a Dask és képességeinek bemutatására, de a célközönséget és az információk mélységét illetően vegyes véleményekkel rendelkezik. Bár jó áttekintést nyújt, és összehasonlítást nyújt a Pandával, gyakran olyan elemi fogalmakba bocsátkozik, amelyek nem feltétlenül relevánsak a célzott olvasók számára.
Előnyök:⬤ Jó bevezetés kezdőknek
⬤ erős magyarázatok a Dask adatszerkezeteiről
⬤ hatékony összehasonlítás a Pandas-szal
⬤ értékes forrás az adattudományi fogalmak megértéséhez
⬤ világos szintaxis és használati esetek.
⬤ Túl alapszintű a középhaladó felhasználók számára
⬤ irreleváns elemi fogalmakat tartalmaz
⬤ az elrendezés és a szerkezet javítható
⬤ néhány technikai problémát észlel
⬤ a tartalom túl részletes lehet a célközönség számára.
(6 olvasói vélemény alapján)
Data Science with Python and Dask
Összefoglaló
A Dask egy natív párhuzamos analitikai eszköz, amelyet úgy terveztek, hogy zökkenőmentesen integrálódjon a már használt könyvtárakkal, köztük a Pandas, a NumPy és a Scikit-Learn könyvtárakkal. A Dask segítségével hatalmas adathalmazokat zúzhatsz és dolgozhatsz velük, a már meglévő eszközeiddel. A Data Science with Python and Dask pedig az Ön útmutatója ahhoz, hogy a Dask-ot adatprojektjeihez úgy használhassa, hogy nem változtatja meg a munkamódszerét.
A nyomtatott könyv megvásárlása magában foglalja a Manning Publications ingyenes e-könyvét PDF, Kindle és ePub formátumban. A nyomtatott könyvben találja a regisztrációs utasításokat.
A technológiáról
Egy hatékony adatcsővezeték mindent jelent egy adattudományi projekt sikere szempontjából. A Dask egy rugalmas könyvtár a párhuzamos számításokhoz Python nyelven, amely megkönnyíti a nagy, elosztott adathalmazok bevitelére és elemzésére szolgáló intuitív munkafolyamatok létrehozását. A Dask dinamikus feladatütemezést és párhuzamos gyűjteményeket biztosít, amelyek kibővítik a NumPy, a Pandas és a Scikit-learn funkcionalitását, lehetővé téve a felhasználók számára, hogy kódjukat egyetlen laptopról könnyedén skálázzák több száz gépből álló klaszterre.
A könyvről
A Data Science with Python and Dask megtanítja, hogyan építsen skálázható projekteket, amelyek hatalmas adathalmazokat képesek kezelni. A Dask keretrendszerrel való megismerkedés után elemezni fogod a NYC Parking Ticket adatbázisban található adatokat, és DataFrames segítségével racionalizálod a folyamatot. Ezután gépi tanulási modelleket hozol létre a Dask-ML segítségével, interaktív vizualizációkat készítesz, és fürtöket építesz az AWS és a Docker segítségével.
Mi van benne?
⬤ Munka nagy, strukturált és strukturálatlan adathalmazokkal.
⬤ Vizualizáció a Seaborn és a Datashader segítségével.
⬤ A saját algoritmusok megvalósítása.
⬤ Elosztott alkalmazások építése a Dask Distributed segítségével.
⬤ Dask alkalmazások csomagolása és telepítése.
Az olvasóról
Adattudósok és fejlesztők számára, akiknek van tapasztalatuk a Python és a PyData stack használatában.
A szerzőről
Jesse Daniel tapasztalt Python-fejlesztő. Python for Data Science-t tanított a Denveri Egyetemen, és egy denveri székhelyű médiatechnológiai vállalat adattudósokból álló csapatát vezeti.
Tartalomjegyzék
1. RÉSZ - A skálázható számítástechnika építőkövei.
⬤ Miért fontos a skálázható számítástechnika.
⬤ A Dask bemutatása.
2. RÉSZ - Munka strukturált adatokkal a Dask DataFrames segítségével.
⬤ A Dask DataFrames bemutatása.
⬤ Adatok betöltése DataFrame-ekbe.
⬤ A DataFrames tisztítása és átalakítása.
⬤ A DataFrames összegzése és elemzése.
⬤ DataFrames vizualizálása Seabornnal.
⬤ Helyadatok vizualizálása Datashaderrel.
RÉSZ - A Dask bővítése és telepítése.
⬤ Munka zsákokkal és tömbökkel.
⬤ Gépi tanulás a Dask-ML segítségével.
⬤ A Dask skálázása és telepítése.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)