Értékelés:
Ez a könyv átfogó forrásként szolgál az Apache Spark elsajátításához, részletes elméleti és gyakorlati betekintést nyújt. Jól szervezett, a Spark különböző összetevőire összpontosít, és hasznos vizuális ábrákat és kódmintákat tartalmaz. A tapasztalt felhasználók számára azonban túlságosan alapszintű lehet, és némi előzetes programozási tudást igényel.
Előnyök:⬤ Nagy alapossággal tárgyalja a Spark elméleti és gyakorlati aspektusait
⬤ jól szervezett és könnyen követhető
⬤ világos útmutatásokat, hasznos vizuális anyagokat és kódmintákat kínál
⬤ jó bevezetést nyújt a Sparkba
⬤ tartalmaz fejezeteket a Delta Lake-ről és az MLlib-ről
⬤ egyaránt alkalmas kezdőknek és tapasztaltabb felhasználóknak, akik felfrissülést keresnek.
⬤ Egyes témákat túl felületesen tárgyal
⬤ a programozás és az adatelemzés alap- vagy középszintű ismereteit igényli
⬤ nem ideális korábbi Spark-tapasztalattal rendelkező felhasználók számára
⬤ a telepítés kihívást jelenthet, különösen a Mac és Windows felhasználók számára
⬤ nem feltétlenül alkalmas a technológia terén teljesen kezdők számára.
(33 olvasói vélemény alapján)
Learning Spark: Lightning-Fast Data Analytics
Az adatok egyre nagyobbak, gyorsabban érkeznek, és sokféle formátumban jelennek meg - és mindezeket az analitika vagy a gépi tanulás érdekében méretarányosan kell feldolgozni. De hogyan lehet ilyen változatos munkameneteket hatékonyan feldolgozni? Lépjen be az Apache Spark.
Frissítve a Spark 3-mal. 0-hoz, ez a második kiadás megmutatja az adatmérnököknek és az adattudósoknak, hogy miért számít a Sparkban a struktúra és az egységesítés. Konkrétan ez a könyv elmagyarázza, hogyan végezzen egyszerű és összetett adatelemzéseket, és hogyan alkalmazzon gépi tanulási algoritmusokat. A lépésről lépésre történő ismertetéseken, kódrészleteken és jegyzetfüzeteken keresztül képes lesz arra, hogy:
⬤ Megtanulja a Python, SQL, Scala vagy Java magas szintű strukturált API-kat.
⬤ Megtanulja a Spark műveleteit és az SQL Engine-t.
⬤ A Spark műveletek vizsgálata, hangolása és hibakeresése a Spark konfigurációk és a Spark UI segítségével.
⬤ Kapcsolódás adatforrásokhoz: JSON, Parquet, CSV, Avro, ORC, Hive, S3 vagy Kafka.
⬤ Elvégzi az analitikát kötegelt és streaming adatokon a Structured Streaming használatával.
⬤ Biztonságos adatvezetékeket építhet nyílt forráskódú Delta Lake és Spark segítségével.
⬤ Gépi tanulási pipelinek fejlesztése az MLlib segítségével és modellek előállítása az MLflow segítségével.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)