Tanuló szikra: Mester adatfeldolgozás méretarányosan

Learning Spark: Villámgyors adatelemzés (S. Damji Jules)

Olvasói vélemények

Összegzés:

Ez a könyv átfogó forrásként szolgál az Apache Spark elsajátításához, részletes elméleti és gyakorlati betekintést nyújt. Jól szervezett, a Spark különböző összetevőire összpontosít, és hasznos vizuális ábrákat és kódmintákat tartalmaz. A tapasztalt felhasználók számára azonban túlságosan alapszintű lehet, és némi előzetes programozási tudást igényel.

Előnyök:

⬤ Nagy alapossággal tárgyalja a Spark elméleti és gyakorlati aspektusait
⬤ jól szervezett és könnyen követhető
⬤ világos útmutatásokat, hasznos vizuális anyagokat és kódmintákat kínál
⬤ jó bevezetést nyújt a Sparkba
⬤ tartalmaz fejezeteket a Delta Lake-ről és az MLlib-ről
⬤ egyaránt alkalmas kezdőknek és tapasztaltabb felhasználóknak, akik felfrissülést keresnek.

Hátrányok:

⬤ Egyes témákat túl felületesen tárgyal
⬤ a programozás és az adatelemzés alap- vagy középszintű ismereteit igényli
⬤ nem ideális korábbi Spark-tapasztalattal rendelkező felhasználók számára
⬤ a telepítés kihívást jelenthet, különösen a Mac és Windows felhasználók számára
⬤ nem feltétlenül alkalmas a technológia terén teljesen kezdők számára.

(33 olvasói vélemény alapján)

Eredeti címe:

Learning Spark: Lightning-Fast Data Analytics

Könyv tartalma:

Az adatok egyre nagyobbak, gyorsabban érkeznek, és sokféle formátumban jelennek meg - és mindezeket az analitika vagy a gépi tanulás érdekében méretarányosan kell feldolgozni. De hogyan lehet ilyen változatos munkameneteket hatékonyan feldolgozni? Lépjen be az Apache Spark.

Frissítve a Spark 3-mal. 0-hoz, ez a második kiadás megmutatja az adatmérnököknek és az adattudósoknak, hogy miért számít a Sparkban a struktúra és az egységesítés. Konkrétan ez a könyv elmagyarázza, hogyan végezzen egyszerű és összetett adatelemzéseket, és hogyan alkalmazzon gépi tanulási algoritmusokat. A lépésről lépésre történő ismertetéseken, kódrészleteken és jegyzetfüzeteken keresztül képes lesz arra, hogy:

⬤ Megtanulja a Python, SQL, Scala vagy Java magas szintű strukturált API-kat.

⬤ Megtanulja a Spark műveleteit és az SQL Engine-t.

⬤ A Spark műveletek vizsgálata, hangolása és hibakeresése a Spark konfigurációk és a Spark UI segítségével.

⬤ Kapcsolódás adatforrásokhoz: JSON, Parquet, CSV, Avro, ORC, Hive, S3 vagy Kafka.

⬤ Elvégzi az analitikát kötegelt és streaming adatokon a Structured Streaming használatával.

⬤ Biztonságos adatvezetékeket építhet nyílt forráskódú Delta Lake és Spark segítségével.

⬤ Gépi tanulási pipelinek fejlesztése az MLlib segítségével és modellek előállítása az MLflow segítségével.

A könyv egyéb adatai:

ISBN:	9781492050049
Szerző:	S. Damji Jules
Kiadó:	Oreilly Media
Kötés:	Puha kötés
A kiadás éve:	2020
Oldalak száma:	300

Vásárlás:

Jelenleg kapható, készleten van.

Learning Spark: Villámgyors adatelemzés

Olvasói vélemények

Eredeti címe:

Könyv tartalma:

A könyv egyéb adatai:

Vásárlás:

A szerző további könyvei:

A szerző munkáit az alábbi kiadók adták ki: