Learning Spark: Villámgyors adatelemzés

Értékelés:   (4.7 az 5-ből)

Learning Spark: Villámgyors adatelemzés (S. Damji Jules)

Olvasói vélemények

Összegzés:

Ez a könyv átfogó forrásként szolgál az Apache Spark elsajátításához, részletes elméleti és gyakorlati betekintést nyújt. Jól szervezett, a Spark különböző összetevőire összpontosít, és hasznos vizuális ábrákat és kódmintákat tartalmaz. A tapasztalt felhasználók számára azonban túlságosan alapszintű lehet, és némi előzetes programozási tudást igényel.

Előnyök:

Nagy alapossággal tárgyalja a Spark elméleti és gyakorlati aspektusait
jól szervezett és könnyen követhető
világos útmutatásokat, hasznos vizuális anyagokat és kódmintákat kínál
jó bevezetést nyújt a Sparkba
tartalmaz fejezeteket a Delta Lake-ről és az MLlib-ről
egyaránt alkalmas kezdőknek és tapasztaltabb felhasználóknak, akik felfrissülést keresnek.

Hátrányok:

Egyes témákat túl felületesen tárgyal
a programozás és az adatelemzés alap- vagy középszintű ismereteit igényli
nem ideális korábbi Spark-tapasztalattal rendelkező felhasználók számára
a telepítés kihívást jelenthet, különösen a Mac és Windows felhasználók számára
nem feltétlenül alkalmas a technológia terén teljesen kezdők számára.

(33 olvasói vélemény alapján)

Eredeti címe:

Learning Spark: Lightning-Fast Data Analytics

Könyv tartalma:

Az adatok egyre nagyobbak, gyorsabban érkeznek, és sokféle formátumban jelennek meg - és mindezeket az analitika vagy a gépi tanulás érdekében méretarányosan kell feldolgozni. De hogyan lehet ilyen változatos munkameneteket hatékonyan feldolgozni? Lépjen be az Apache Spark.

Frissítve a Spark 3-mal. 0-hoz, ez a második kiadás megmutatja az adatmérnököknek és az adattudósoknak, hogy miért számít a Sparkban a struktúra és az egységesítés. Konkrétan ez a könyv elmagyarázza, hogyan végezzen egyszerű és összetett adatelemzéseket, és hogyan alkalmazzon gépi tanulási algoritmusokat. A lépésről lépésre történő ismertetéseken, kódrészleteken és jegyzetfüzeteken keresztül képes lesz arra, hogy:

⬤ Megtanulja a Python, SQL, Scala vagy Java magas szintű strukturált API-kat.

⬤ Megtanulja a Spark műveleteit és az SQL Engine-t.

⬤ A Spark műveletek vizsgálata, hangolása és hibakeresése a Spark konfigurációk és a Spark UI segítségével.

⬤ Kapcsolódás adatforrásokhoz: JSON, Parquet, CSV, Avro, ORC, Hive, S3 vagy Kafka.

⬤ Elvégzi az analitikát kötegelt és streaming adatokon a Structured Streaming használatával.

⬤ Biztonságos adatvezetékeket építhet nyílt forráskódú Delta Lake és Spark segítségével.

⬤ Gépi tanulási pipelinek fejlesztése az MLlib segítségével és modellek előállítása az MLflow segítségével.

A könyv egyéb adatai:

ISBN:9781492050049
Szerző:
Kiadó:
Kötés:Puha kötés
A kiadás éve:2020
Oldalak száma:300

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Learning Spark: Villámgyors adatelemzés - Learning Spark: Lightning-Fast Data Analytics
Az adatok egyre nagyobbak, gyorsabban érkeznek, és sokféle...
Learning Spark: Villámgyors adatelemzés - Learning Spark: Lightning-Fast Data Analytics

A szerző munkáit az alábbi kiadók adták ki:

© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)