Értékelés:
A könyv a modern adatarchitektúrák mélyreható és alapos feltárását nyújtja, a delta-architektúrára, az adatkezelésre és az adattermékek adathálós keretrendszerben történő felépítésére összpontosítva. Hangsúlyt fektet továbbá az adatvizualizációk fontosságára és a Python nyelv segítségével történő gyakorlati alkalmazásokra valós forgatókönyvekben.
Előnyök:A modern adatarchitektúrák átfogó lefedettsége, gyakorlati példák Pythonban, az adatkezelés és az adatintegritás alapos feltárása, a MLOps-ra és az adatvizualizációk integrálására való összpontosítás, mérnökök, elemzők és vezetők számára egyaránt hozzáférhető.
Hátrányok:Az adatarchitektúrák előzetes ismerete nélkül túlságosan technikai jellegű lehet a kezdők számára, egyes olvasók számára a mélység nyomasztó lehet, és nem minden témát fed le részletesen.
(5 olvasói vélemény alapján)
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Skálázható és megbízható adat-ökoszisztémák kiépítése a Data Mesh, a Databricks Spark és a Kafka segítségével
Key Features:
⬤ A feltörekvő technológiákban használt modern adatismeretek fejlesztése.
⬤ Tanuljon pragmatikus tervezési módszereket, mint például a Data Mesh és az adathalmok.
⬤ Mélyebb megértést szerezzen az adatkezelésről.
⬤ A nyomtatott vagy Kindle könyv megvásárlása egy ingyenes PDF e-könyvet is tartalmaz.
A könyv leírása:
A Modern adatarchitektúrák Pythonnal megtanítja, hogyan illesztheti zökkenőmentesen a gépi tanulás és az adattudományi munkafolyamatokat a nyílt adatplatformokba. Megtanulja, hogyan vegye az adatait, és hozzon létre olyan nyílt tóházakat, amelyek bármilyen technológiával működnek a bevált technikák, köztük a medalion architektúra és a Delta Lake segítségével.
Ez a könyv az alapoktól kezdve segít a nyílt adatplatformon, a Databricks-en, SQL és Python segítségével csővezetékeket építeni. Megismerkedhet a Pythonban írt jegyzetfüzetekkel és alkalmazásokkal, amelyekhez olyan szabványos szoftverfejlesztési eszközöket használ, mint a git, a pre-commit, a Jenkins és a Github. Ezután elmélyülsz az Apache Spark és a Confluent Kafka használatával megvalósuló streaming és kötegelt adatfeldolgozásban. Ahogy haladsz előre, megtanulod, hogyan telepítheted erőforrásaidat infrastruktúra mint kód használatával, és hogyan automatizálhatod a munkafolyamatokat és a kódfejlesztést. Mivel minden adatplatformnak létfontosságú eleme az AI és az ML kezelésének és az azzal való munkavégzésnek a képessége, az ML alapjait is megismerheti, valamint azt, hogy hogyan dolgozzon a modern MLOps eszközrendszerekkel. Végül gyakorlati tapasztalatot szerezhetsz az Apache Sparkkal, a mai piac egyik legfontosabb adattechnológiájával.
A könyv végére rengeteg gyakorlati és elméleti tudást fog felhalmozni ahhoz, hogy felépíthesse, kezelhesse, hangszerelhesse és architektúrázhassa adatökoszisztémáit.
Amit tanulni fog:
⬤ Az adatminták megértése, beleértve a delta architektúrát is.
⬤ Találja meg, hogyan növelheti a teljesítményt a Spark belső tulajdonságaival.
⬤ Tudja meg, hogyan tervezzen kritikus adatsémákat.
⬤ Felfedezze az MLOps-ot olyan eszközökkel, mint az AutoML és az MLflow.
⬤ Az adathálóban lévő adattermékek építésével kapcsolatos ismeretek elsajátítása.
⬤ Fedezze fel az adatkezelést, és építsen bizalmat az adataiba.
⬤ Vezesse be az adatvizualizációkat és műszerfalakat az adatgyakorlatába.
Kinek szól ez a könyv:
Ez a könyv fejlesztőknek, elemzőmérnököknek és vezetőknek szól, akik tovább szeretnék fejleszteni az adatökoszisztémát a szervezetükben. Bár ezek nem előfeltételek, a Python alapszintű ismerete és az adatokkal kapcsolatos korábbi tapasztalat segít a példák olvasásában és követésében.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)