Adattudomány Python és Dask segítségével

Értékelés:   (4.5 az 5-ből)

Adattudomány Python és Dask segítségével (Jesse Daniel)

Olvasói vélemények

Összegzés:

A könyv bevezetésként szolgál a Dask és képességeinek bemutatására, de a célközönséget és az információk mélységét illetően vegyes véleményekkel rendelkezik. Bár jó áttekintést nyújt, és összehasonlítást nyújt a Pandával, gyakran olyan elemi fogalmakba bocsátkozik, amelyek nem feltétlenül relevánsak a célzott olvasók számára.

Előnyök:

Jó bevezetés kezdőknek
erős magyarázatok a Dask adatszerkezeteiről
hatékony összehasonlítás a Pandas-szal
értékes forrás az adattudományi fogalmak megértéséhez
világos szintaxis és használati esetek.

Hátrányok:

Túl alapszintű a középhaladó felhasználók számára
irreleváns elemi fogalmakat tartalmaz
az elrendezés és a szerkezet javítható
néhány technikai problémát észlel
a tartalom túl részletes lehet a célközönség számára.

(6 olvasói vélemény alapján)

Eredeti címe:

Data Science with Python and Dask

Könyv tartalma:

Összefoglaló

A Dask egy natív párhuzamos analitikai eszköz, amelyet úgy terveztek, hogy zökkenőmentesen integrálódjon a már használt könyvtárakkal, köztük a Pandas, a NumPy és a Scikit-Learn könyvtárakkal. A Dask segítségével hatalmas adathalmazokat zúzhatsz és dolgozhatsz velük, a már meglévő eszközeiddel. A Data Science with Python and Dask pedig az Ön útmutatója ahhoz, hogy a Dask-ot adatprojektjeihez úgy használhassa, hogy nem változtatja meg a munkamódszerét.

A nyomtatott könyv megvásárlása magában foglalja a Manning Publications ingyenes e-könyvét PDF, Kindle és ePub formátumban. A nyomtatott könyvben találja a regisztrációs utasításokat.

A technológiáról

Egy hatékony adatcsővezeték mindent jelent egy adattudományi projekt sikere szempontjából. A Dask egy rugalmas könyvtár a párhuzamos számításokhoz Python nyelven, amely megkönnyíti a nagy, elosztott adathalmazok bevitelére és elemzésére szolgáló intuitív munkafolyamatok létrehozását. A Dask dinamikus feladatütemezést és párhuzamos gyűjteményeket biztosít, amelyek kibővítik a NumPy, a Pandas és a Scikit-learn funkcionalitását, lehetővé téve a felhasználók számára, hogy kódjukat egyetlen laptopról könnyedén skálázzák több száz gépből álló klaszterre.

A könyvről

A Data Science with Python and Dask megtanítja, hogyan építsen skálázható projekteket, amelyek hatalmas adathalmazokat képesek kezelni. A Dask keretrendszerrel való megismerkedés után elemezni fogod a NYC Parking Ticket adatbázisban található adatokat, és DataFrames segítségével racionalizálod a folyamatot. Ezután gépi tanulási modelleket hozol létre a Dask-ML segítségével, interaktív vizualizációkat készítesz, és fürtöket építesz az AWS és a Docker segítségével.

Mi van benne?

⬤ Munka nagy, strukturált és strukturálatlan adathalmazokkal.

⬤ Vizualizáció a Seaborn és a Datashader segítségével.

⬤ A saját algoritmusok megvalósítása.

⬤ Elosztott alkalmazások építése a Dask Distributed segítségével.

⬤ Dask alkalmazások csomagolása és telepítése.

Az olvasóról

Adattudósok és fejlesztők számára, akiknek van tapasztalatuk a Python és a PyData stack használatában.

A szerzőről

Jesse Daniel tapasztalt Python-fejlesztő. Python for Data Science-t tanított a Denveri Egyetemen, és egy denveri székhelyű médiatechnológiai vállalat adattudósokból álló csapatát vezeti.

Tartalomjegyzék

1. RÉSZ - A skálázható számítástechnika építőkövei.

⬤ Miért fontos a skálázható számítástechnika.

⬤ A Dask bemutatása.

2. RÉSZ - Munka strukturált adatokkal a Dask DataFrames segítségével.

⬤ A Dask DataFrames bemutatása.

⬤ Adatok betöltése DataFrame-ekbe.

⬤ A DataFrames tisztítása és átalakítása.

⬤ A DataFrames összegzése és elemzése.

⬤ DataFrames vizualizálása Seabornnal.

⬤ Helyadatok vizualizálása Datashaderrel.

RÉSZ - A Dask bővítése és telepítése.

⬤ Munka zsákokkal és tömbökkel.

⬤ Gépi tanulás a Dask-ML segítségével.

⬤ A Dask skálázása és telepítése.

A könyv egyéb adatai:

ISBN:9781617295607
Szerző:
Kiadó:
Kötés:Puha kötés
A kiadás éve:2019
Oldalak száma:296

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Adattudomány Python és Dask segítségével - Data Science with Python and Dask
Összefoglaló A Dask egy natív párhuzamos analitikai eszköz, amelyet úgy...
Adattudomány Python és Dask segítségével - Data Science with Python and Dask

A szerző munkáit az alábbi kiadók adták ki:

© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)