Értékelés:
A könyv a Hadoop és a Big Data analitika elsajátításához nyújt segítséget, és mind az alapozó, mind a haladó témákra összpontosít. Bár széles körű áttekintést nyújt a Hadoop ökoszisztémáról, és gyakorlati példákat is tartalmaz, jelentős problémák vannak a kód pontosságával és az írás egyértelműségével.
Előnyök:⬤ Átfogó áttekintés a Hadoopról és a kapcsolódó technológiákról
⬤ barátságos a kezdők és a profik számára egyaránt
⬤ a példák hasznosak a gyakorlati tanuláshoz
⬤ naprakész mind a régi, mind az új technológiák, például a MapReduce és a Spark tekintetében
⬤ hivatkozásokat biztosít a további olvasáshoz.
⬤ A példakódok gyakran nem egyeznek a könyvben található leírásokkal
⬤ a telepítési utasítások zavarosak lehetnek
⬤ a példák hibás eredményeket adhatnak
⬤ az írásmódot kritika éri, hogy nem eléggé minőségi
⬤ egyes információk félrevezetőek vagy helytelenek.
(9 olvasói vélemény alapján)
Data Analytics with Hadoop: An Introduction for Data Scientists
Készen áll a statisztikai és gépi tanulási technikák alkalmazására nagy adathalmazokon? Ez a gyakorlati útmutató megmutatja, miért tökéletes a Hadoop ökoszisztéma erre a feladatra. Az elosztott számítástechnikához általában társított telepítés, üzemeltetés vagy szoftverfejlesztés helyett az építhető konkrét elemzésekre, a Hadoop által biztosított adattárházi technikákra és az ezzel a keretrendszerrel létrehozható magasabb rendű adatmunkafolyamatokra összpontosít.
Az adattudósok és elemzők megtanulják, hogyan hajtsák végre a technikák széles skáláját, a MapReduce és Spark alkalmazások Python nyelven történő írásától a fejlett modellezés és adatkezelés Spark MLlib, Hive és HBase segítségével történő alkalmazásáig. Emellett megismerheti az olyan analitikai folyamatokat és adatrendszereket is, amelyekkel olyan adattermékeket építhet és fejleszthet, amelyek képesek kezelni - és valójában igénylik is - a hatalmas adatmennyiségeket.
⬤ A Hadoop és a fürtszámítás mögötti alapvető fogalmak megértése.
⬤ Tervezési minták és párhuzamos analitikai algoritmusok használata elosztott adatelemzési feladatok létrehozásához.
⬤ Tanulja meg az Apache Hive és a HBase használatával az adatkezelést, adatbányászatot és adattárházakat elosztott környezetben.
⬤ A Sqoop és az Apache Flume használata relációs adatbázisokból származó adatok bevitelére.
⬤ Programozzon komplex Hadoop és Spark alkalmazásokat az Apache Pig és Spark DataFrames segítségével.
⬤ Masinatanulási technikák, például osztályozás, klaszterezés és kollaboratív szűrés végrehajtása a Spark MLlib segítségével.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)