Nagy teljesítményű szikra: Legjobb gyakorlatok az Apache Spark méretezéséhez és optimalizálásához

Értékelés:   (4.2 az 5-ből)

Nagy teljesítményű szikra: Legjobb gyakorlatok az Apache Spark méretezéséhez és optimalizálásához (Holden Karau)

Olvasói vélemények

Összegzés:

A „High Performance Spark” című könyv a hatékony Spark kód írásának részletes feltárását kínálja, amely a Scala és a Spark előzetes ismereteivel rendelkező szakemberek számára is alkalmas. A könyv a teljesítményoptimalizálásra összpontosít, és alapos kódpéldákkal szolgál, főként Scala nyelven. Míg egyes felhasználók jól strukturált és informatív forrásnak találták a könyvet, mások kritizálták a kezdők számára való hozzáférhetőségét és a Scalára való nagyfokú támaszkodást.

Előnyök:

Átfogó útmutató a nagy teljesítményű Spark-kód írásához.
Részletes magyarázatok a fejlett fogalmakról és optimalizálási technikákról.
Jól strukturált, az elmélet és a gyakorlati alkalmazások jó egyensúlyával.
Gazdag kódpéldákkal, amelyek elősegítik a megértést, különösen a Scalában jártasak számára.
Letisztult, egyszerű bemutatás és hasznos diagramok.

Hátrányok:

Nem alkalmas kezdőknek; a Spark és a Scala előzetes ismerete szükséges.
A Scalára való erős összpontosítás elidegenítheti a nyelvet nem ismerő felhasználókat.
Néhány felhasználó úgy érezte, hogy a gyakorlati Spark-környezet nélkül túl sűrű és kihívást jelent.
Bizonyos témák, például a Spark streaming korlátozott lefedettsége.
Néhányan unalmasnak találták a túl sok kódolási példa miatt.

(27 olvasói vélemény alapján)

Eredeti címe:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Könyv tartalma:

Az Apache Spark elképesztő, amikor minden klappol. Ha azonban nem tapasztalta a várt teljesítménynövekedést, vagy még mindig nem érzi magát elég magabiztosnak ahhoz, hogy a Sparkot termelésben használja, akkor ez a gyakorlatias könyv Önnek szól. A szerzők, Holden Karau és Rachel Warren olyan teljesítményoptimalizálásokat mutatnak be, amelyek segítségével a Spark-lekérdezések gyorsabban futnak, és nagyobb adatméretekkel is megbirkóznak, miközben kevesebb erőforrást használnak.

Ez a könyv ideális a nagyméretű adatalkalmazásokkal dolgozó szoftvermérnökök, adatmérnökök, fejlesztők és rendszergazdák számára, mivel olyan technikákat ismertet, amelyekkel csökkenthetők az adatinfrastruktúra költségei és a fejlesztők munkaideje. Nemcsak a Spark átfogóbb megértésére tesz szert, hanem azt is megtanulja, hogyan tegye énekelhetővé.

Ezzel a könyvvel felfedezheti:

⬤ Hogyan javítják a Spark SQL új interfészei a teljesítményt az SQL RDD adatszerkezetéhez képest.

⬤ A Core Spark és a Spark SQL adatösszekötések közötti választás.

⬤ Technikák a szabványos RDD-transzformációk maximális kihasználásához.

⬤ Hogyan lehet a Spark kulcs/értékpáros paradigmájának teljesítményproblémáit megkerülni.

⬤ Nagy teljesítményű Spark kód írása Scala vagy JVM nélkül.

⬤ Hogyan teszteljük a funkcionalitást és a teljesítményt a javasolt fejlesztések alkalmazásakor.

⬤ A Spark MLlib és a Spark ML gépi tanulási könyvtárak használata.

⬤ A Spark Streaming komponensei és külső közösségi csomagok.

A könyv egyéb adatai:

ISBN:9781491943205
Szerző:
Kiadó:
Kötés:Puha kötés
A kiadás éve:2017
Oldalak száma:358

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Nagy teljesítményű szikra: Legjobb gyakorlatok az Apache Spark méretezéséhez és optimalizálásához -...
Az Apache Spark elképesztő, amikor minden klappol...
Nagy teljesítményű szikra: Legjobb gyakorlatok az Apache Spark méretezéséhez és optimalizálásához - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Python skálázása Ray-jel: Kalandozások a felhő- és szervermentes mintákban - Scaling Python with...
A szerver nélküli számítástechnika lehetővé teszi...
Python skálázása Ray-jel: Kalandozások a felhő- és szervermentes mintákban - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Scaling Python with Dask: Az adattudománytól a gépi tanulásig - Scaling Python with Dask: From Data...
A modern rendszerek többmagos CPU-kat és GPU-kat...
Scaling Python with Dask: Az adattudománytól a gépi tanulásig - Scaling Python with Dask: From Data Science to Machine Learning

A szerző munkáit az alábbi kiadók adták ki:

© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)