Data Engineering with Python: Munka hatalmas adathalmazokkal adatmodellek tervezése és adatpipelinek automatizálása Python segítségével

Értékelés:   (4.1 az 5-ből)

Data Engineering with Python: Munka hatalmas adathalmazokkal adatmodellek tervezése és adatpipelinek automatizálása Python segítségével (Paul Crickard)

Olvasói vélemények

Összegzés:

A 'Data Engineering With Python' című könyv a felhasználói vélemények szerint vegyesen tartalmaz előnyöket és hátrányokat. Bár szilárd bevezetést nyújt az adatmérnöki kulcsfogalmakba, és olvasmányosnak minősül gyakorlati példákkal, a technikai pontossággal és a naprakész tartalommal kapcsolatos jelentős problémákkal küzd. Több olvasó úgy találta, hogy a könyv címét tekintve félrevezető, hogy bizonyos eszközökre, különösen a NiFi-re összpontosít, és sokan számoltak be arról, hogy rengeteg hibával és rossz szerkesztéssel találkoztak, amelyek akadályozzák az anyag gyakorlati alkalmazását.

Előnyök:

Szilárd bevezetés az adatechnikai fogalmakba és a pipeliningbe.
Gyakorlati és szemléletes példák, különösen az olyan eszközökkel, mint a Pandas, a Zookeeper, a Kafka és a Spark.
Hasznos az átmenő szoftvermérnökök és az adatelemzéssel ismerkedők számára.
Az adatechnika számos eszközének és fogalmának lefedése.
Könnyen olvasható.

Hátrányok:

Számos hiba és elgépelés a könyvben, ami frusztrációhoz vezet.
Az elavult tartalom és a telepítési utasítások kritikusan befolyásolják a használhatóságot.
Nagy hangsúlyt fektet az SQL-re, a NoSQL adatbázisok minimális lefedettségével.
Oktatási hiányosságok, különösen az olyan eszközök beállításával kapcsolatban, mint a NiFi.
Félrevezető cím, mivel a NiFi-t hangsúlyozza a Python használatával szemben.
A példák és hivatkozások nem egyértelműek, ami kihívást jelent a kezdők számára.

(27 olvasói vélemény alapján)

Eredeti címe:

Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Könyv tartalma:

Építsen, monitorozzon és kezeljen valós idejű adatvezetékeket, hogy nyílt forráskódú Apache projektek segítségével hatékonyan hozzon létre adatmérnöki infrastruktúrát

Főbb jellemzők:

⬤ Legyen jártas az adatarchitektúrákban, az adatelőkészítésben és az adatoptimalizálási készségekben gyakorlati példák segítségével.

⬤ Tervezzen adatmodelleket, és tanulja meg, hogyan lehet adatokat kivonni, átalakítani és betölteni (ETL) Python segítségével.

⬤ Tervezze, automatizálja és felügyelje a komplex adatvezetékeket a termelésben.

Könyv leírása

Az adattervezés az adattudomány és az analitika alapját képezi, és minden vállalkozás fontos részét képezi. Ez a könyv segít felfedezni a különböző eszközöket és módszereket, amelyeket az adatmérnöki folyamat megértéséhez használnak Python segítségével.

A könyv megmutatja, hogyan kezelheti az adatkezelés különböző aspektusaiban gyakran felmerülő kihívásokat. Az adatechnika alapjainak bemutatásával kezd, valamint a nagy adathalmazokkal való munkavégzéshez szükséges technológiák és keretrendszerek adatpipeline-ok kialakításához szükséges technológiákkal és keretrendszerekkel együtt. Megtanulja, hogyan alakítsa át és tisztítsa meg az adatokat, és végezzen elemzést, hogy a legtöbbet hozhassa ki az adatokból. Ahogy halad előre, felfedezi, hogyan dolgozzon különböző összetettségű nagyméretű adatokkal és termelési adatbázisokkal, valamint hogyan építsen adatpipeline-okat. Valós példák segítségével építészeti architektúrákat hoz létre, amelyeken megtanulja, hogyan kell adatpipeline-okat telepíteni.

E Python-könyv végére világos képet kap az adatmodellezési technikákról, és képes lesz magabiztosan adatmérnöki pipelineseket építeni az adatok nyomon követésére, a minőségi ellenőrzések lefuttatására és a szükséges változtatások elvégzésére a termelésben.

Amit megtanulhat

⬤ Megérti, hogyan támogatja az adatmérnökség az adattudományi munkafolyamatokat.

⬤ Felfedezi, hogyan lehet adatokat kinyerni fájlokból és adatbázisokból, majd megtisztítani, átalakítani és dúsítani azokat.

⬤ Konfigurálja a feldolgozókat a különböző fájlformátumok, valamint a relációs és NoSQL adatbázisok kezelésére.

⬤ Tudja meg, hogyan valósíthat meg adatcsővezetéket és műszerfalat az eredmények vizualizálásához.

⬤ Használja az adatellenőrzést és az érvényesítést az adatoknak a raktárba kerülés előtti ellenőrzésére.

⬤ Hozzon létre valós idejű csővezetékeket olyan staging területekkel, amelyek validálást végeznek és kezelik a hibákat.

⬤ Kezdje meg a csővezetékek telepítését a termelési környezetben.

Kinek szól ez a könyv

Ez a könyv adatelemzőknek, ETL-fejlesztőknek és mindazoknak szól, akik az adatmérnöki munkába szeretnének belekezdeni vagy átállni az adatmérnökség területére, illetve felfrissíteni a Python használatával kapcsolatos ismereteiket. Ez a könyv hasznos lesz az adatmérnöki karrier építését tervező diákok vagy az átállásra készülő informatikai szakemberek számára is. Az adatmérnökséggel kapcsolatos előzetes ismeretek nem szükségesek.

A könyv egyéb adatai:

ISBN:9781839214189
Szerző:
Kiadó:
Kötés:Puha kötés

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Data Engineering with Python: Munka hatalmas adathalmazokkal adatmodellek tervezése és adatpipelinek...
Építsen, monitorozzon és kezeljen valós idejű...
Data Engineering with Python: Munka hatalmas adathalmazokkal adatmodellek tervezése és adatpipelinek automatizálása Python segítségével - Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

A szerző munkáit az alábbi kiadók adták ki:

© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)