Értékelés:
A „High Performance Spark” című könyv a hatékony Spark kód írásának részletes feltárását kínálja, amely a Scala és a Spark előzetes ismereteivel rendelkező szakemberek számára is alkalmas. A könyv a teljesítményoptimalizálásra összpontosít, és alapos kódpéldákkal szolgál, főként Scala nyelven. Míg egyes felhasználók jól strukturált és informatív forrásnak találták a könyvet, mások kritizálták a kezdők számára való hozzáférhetőségét és a Scalára való nagyfokú támaszkodást.
Előnyök:⬤ Átfogó útmutató a nagy teljesítményű Spark-kód írásához.
⬤ Részletes magyarázatok a fejlett fogalmakról és optimalizálási technikákról.
⬤ Jól strukturált, az elmélet és a gyakorlati alkalmazások jó egyensúlyával.
⬤ Gazdag kódpéldákkal, amelyek elősegítik a megértést, különösen a Scalában jártasak számára.
⬤ Letisztult, egyszerű bemutatás és hasznos diagramok.
⬤ Nem alkalmas kezdőknek; a Spark és a Scala előzetes ismerete szükséges.
⬤ A Scalára való erős összpontosítás elidegenítheti a nyelvet nem ismerő felhasználókat.
⬤ Néhány felhasználó úgy érezte, hogy a gyakorlati Spark-környezet nélkül túl sűrű és kihívást jelent.
⬤ Bizonyos témák, például a Spark streaming korlátozott lefedettsége.
⬤ Néhányan unalmasnak találták a túl sok kódolási példa miatt.
(27 olvasói vélemény alapján)
High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Az Apache Spark elképesztő, amikor minden klappol. Ha azonban nem tapasztalta a várt teljesítménynövekedést, vagy még mindig nem érzi magát elég magabiztosnak ahhoz, hogy a Sparkot termelésben használja, akkor ez a gyakorlatias könyv Önnek szól. A szerzők, Holden Karau és Rachel Warren olyan teljesítményoptimalizálásokat mutatnak be, amelyek segítségével a Spark-lekérdezések gyorsabban futnak, és nagyobb adatméretekkel is megbirkóznak, miközben kevesebb erőforrást használnak.
Ez a könyv ideális a nagyméretű adatalkalmazásokkal dolgozó szoftvermérnökök, adatmérnökök, fejlesztők és rendszergazdák számára, mivel olyan technikákat ismertet, amelyekkel csökkenthetők az adatinfrastruktúra költségei és a fejlesztők munkaideje. Nemcsak a Spark átfogóbb megértésére tesz szert, hanem azt is megtanulja, hogyan tegye énekelhetővé.
Ezzel a könyvvel felfedezheti:
⬤ Hogyan javítják a Spark SQL új interfészei a teljesítményt az SQL RDD adatszerkezetéhez képest.
⬤ A Core Spark és a Spark SQL adatösszekötések közötti választás.
⬤ Technikák a szabványos RDD-transzformációk maximális kihasználásához.
⬤ Hogyan lehet a Spark kulcs/értékpáros paradigmájának teljesítményproblémáit megkerülni.
⬤ Nagy teljesítményű Spark kód írása Scala vagy JVM nélkül.
⬤ Hogyan teszteljük a funkcionalitást és a teljesítményt a javasolt fejlesztések alkalmazásakor.
⬤ A Spark MLlib és a Spark ML gépi tanulási könyvtárak használata.
⬤ A Spark Streaming komponensei és külső közösségi csomagok.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)