Értékelés:
A 'Data Engineering With Python' című könyv a felhasználói vélemények szerint vegyesen tartalmaz előnyöket és hátrányokat. Bár szilárd bevezetést nyújt az adatmérnöki kulcsfogalmakba, és olvasmányosnak minősül gyakorlati példákkal, a technikai pontossággal és a naprakész tartalommal kapcsolatos jelentős problémákkal küzd. Több olvasó úgy találta, hogy a könyv címét tekintve félrevezető, hogy bizonyos eszközökre, különösen a NiFi-re összpontosít, és sokan számoltak be arról, hogy rengeteg hibával és rossz szerkesztéssel találkoztak, amelyek akadályozzák az anyag gyakorlati alkalmazását.
Előnyök:⬤ Szilárd bevezetés az adatechnikai fogalmakba és a pipeliningbe.
⬤ Gyakorlati és szemléletes példák, különösen az olyan eszközökkel, mint a Pandas, a Zookeeper, a Kafka és a Spark.
⬤ Hasznos az átmenő szoftvermérnökök és az adatelemzéssel ismerkedők számára.
⬤ Az adatechnika számos eszközének és fogalmának lefedése.
⬤ Könnyen olvasható.
⬤ Számos hiba és elgépelés a könyvben, ami frusztrációhoz vezet.
⬤ Az elavult tartalom és a telepítési utasítások kritikusan befolyásolják a használhatóságot.
⬤ Nagy hangsúlyt fektet az SQL-re, a NoSQL adatbázisok minimális lefedettségével.
⬤ Oktatási hiányosságok, különösen az olyan eszközök beállításával kapcsolatban, mint a NiFi.
⬤ Félrevezető cím, mivel a NiFi-t hangsúlyozza a Python használatával szemben.
⬤ A példák és hivatkozások nem egyértelműek, ami kihívást jelent a kezdők számára.
(27 olvasói vélemény alapján)
Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python
Építsen, monitorozzon és kezeljen valós idejű adatvezetékeket, hogy nyílt forráskódú Apache projektek segítségével hatékonyan hozzon létre adatmérnöki infrastruktúrát
Főbb jellemzők:
⬤ Legyen jártas az adatarchitektúrákban, az adatelőkészítésben és az adatoptimalizálási készségekben gyakorlati példák segítségével.
⬤ Tervezzen adatmodelleket, és tanulja meg, hogyan lehet adatokat kivonni, átalakítani és betölteni (ETL) Python segítségével.
⬤ Tervezze, automatizálja és felügyelje a komplex adatvezetékeket a termelésben.
Könyv leírása
Az adattervezés az adattudomány és az analitika alapját képezi, és minden vállalkozás fontos részét képezi. Ez a könyv segít felfedezni a különböző eszközöket és módszereket, amelyeket az adatmérnöki folyamat megértéséhez használnak Python segítségével.
A könyv megmutatja, hogyan kezelheti az adatkezelés különböző aspektusaiban gyakran felmerülő kihívásokat. Az adatechnika alapjainak bemutatásával kezd, valamint a nagy adathalmazokkal való munkavégzéshez szükséges technológiák és keretrendszerek adatpipeline-ok kialakításához szükséges technológiákkal és keretrendszerekkel együtt. Megtanulja, hogyan alakítsa át és tisztítsa meg az adatokat, és végezzen elemzést, hogy a legtöbbet hozhassa ki az adatokból. Ahogy halad előre, felfedezi, hogyan dolgozzon különböző összetettségű nagyméretű adatokkal és termelési adatbázisokkal, valamint hogyan építsen adatpipeline-okat. Valós példák segítségével építészeti architektúrákat hoz létre, amelyeken megtanulja, hogyan kell adatpipeline-okat telepíteni.
E Python-könyv végére világos képet kap az adatmodellezési technikákról, és képes lesz magabiztosan adatmérnöki pipelineseket építeni az adatok nyomon követésére, a minőségi ellenőrzések lefuttatására és a szükséges változtatások elvégzésére a termelésben.
Amit megtanulhat
⬤ Megérti, hogyan támogatja az adatmérnökség az adattudományi munkafolyamatokat.
⬤ Felfedezi, hogyan lehet adatokat kinyerni fájlokból és adatbázisokból, majd megtisztítani, átalakítani és dúsítani azokat.
⬤ Konfigurálja a feldolgozókat a különböző fájlformátumok, valamint a relációs és NoSQL adatbázisok kezelésére.
⬤ Tudja meg, hogyan valósíthat meg adatcsővezetéket és műszerfalat az eredmények vizualizálásához.
⬤ Használja az adatellenőrzést és az érvényesítést az adatoknak a raktárba kerülés előtti ellenőrzésére.
⬤ Hozzon létre valós idejű csővezetékeket olyan staging területekkel, amelyek validálást végeznek és kezelik a hibákat.
⬤ Kezdje meg a csővezetékek telepítését a termelési környezetben.
Kinek szól ez a könyv
Ez a könyv adatelemzőknek, ETL-fejlesztőknek és mindazoknak szól, akik az adatmérnöki munkába szeretnének belekezdeni vagy átállni az adatmérnökség területére, illetve felfrissíteni a Python használatával kapcsolatos ismereteiket. Ez a könyv hasznos lesz az adatmérnöki karrier építését tervező diákok vagy az átállásra készülő informatikai szakemberek számára is. Az adatmérnökséggel kapcsolatos előzetes ismeretek nem szükségesek.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)