Értékelés:
A 'Querying Databricks with Spark SQL' című könyv alaposan tárgyalja a Spark SQL alap- és haladó koncepcióit. Jól felépített, üzleti forgatókönyvekkel mutatja be az SQL-lekérdezéseket, és világos magyarázatokat ad. Néhány olvasó azonban problémákat talált az utasításokkal és a szervezéssel kapcsolatban.
Előnyök:⬤ Átfogó lefedettség a Spark SQL-ről, kezdő és haladó felhasználók számára egyaránt alkalmas
⬤ világos szerkezet és magyarázatok
⬤ jól megtervezett mintaadatbázis
⬤ értékes 'Trükkök és csapdák' rész
⬤ kielégítő olvasmány a haladó témákat kereső SQL-szakemberek számára.
⬤ Az adatkészlet beállítására vonatkozó utasítások nem voltak egyértelműek
⬤ a GitHub-források rosszul voltak megszervezve
⬤ a könyvkötés minőségén lehetne javítani
⬤ kimaradtak olyan témák, mint az SQL MERGE, UPDATE, DELETE utasítások
⬤ kezdeti zökkenő az adatfájlok importálására vonatkozó utasításokkal.
(2 olvasói vélemény alapján)
Querying Databricks with Spark SQL
Gyakorlati útmutató a Spark SQL használatához a Databricks-adatokon történő összetett lekérdezések végrehajtásához
Főbb jellemzők
● Tanulja meg az SQL-t az alapoktól kezdve, előzetes programozási vagy SQL-ismeretek nélkül.
● Fokozatosan építi tudását és készségeit, az alapvető adatlekérdezéstől az összetett elemzésekig.
● Gyakorlati tapasztalatszerzés az SQL-el, amely a kezdőtől a szakértőig minden tudásszintet lefed.
Leírás
A Databricks kiemelkedik az adattavak létrehozására szánt, széles körben elfogadott platformként. Keretrendszerén belül kiterjeszti a támogatást a strukturált lekérdezési nyelv (SQL) Spark SQL néven ismert speciális változatára. Ha szeretne többet megtudni arról, hogyan használhatja a Spark SQL-t az adatok elemzésére egy adattavon belül, akkor ez a könyv Önnek szól.
A könyv az alapvető lekérdezésektől az összetett adatfeldolgozási feladatokig mindent lefed. Az SQL és a Spark bevezetésével kezdődik. Ezután az SQL alapjaival foglalkozik, beleértve az adattípusokat, az operátorokat és a záradékokat. A következő fejezetek a szűrésre, az aggregálásra és a számításra összpontosítanak. Emellett kitér a dátumokra és időpontokra, a kimenet formázására és a logika használatára a lekérdezésekben. Kitér továbbá a táblázatok összekapcsolására, az alkérdésekre, a származtatott táblázatokra és a gyakori táblázatos kifejezésekre. Emellett tárgyalja a korrelált alkérdéseket, az adathalmazok összekapcsolását és szűrését, az SQL használatát a számításokban, az adatok szegmentálását és osztályozását, a gördülő elemzést és az adatok időbeli elemzését. A könyv a fejlett adatbemutatásról szóló fejezettel zárul.
A könyv végére Ön képes lesz a Spark SQL segítségével összetett adatelemzési feladatokat végrehajtani adattavakon.
Amit megtanulhat
● A Spark SQL használata az adatok adattóból való kiolvasásához.
● Megtanulja, hogyan szűrhet, aggregálhat és számolhat adatokat a Spark SQL segítségével.
● Megtanulja, hogyan lehet táblákat összekapcsolni, alkérdéseket használni és származtatott táblákat létrehozni a Spark SQL-ben.
● Az adatok időbeli elemzése a Spark SQL segítségével a trendek nyomon követése és az adatokban lévő minták azonosítása érdekében.
● Az adatok vizuálisan vonzó módon történő bemutatása a Spark SQL segítségével.
Kinek szól ez a könyv
Ez a könyv mindenkinek szól, aki meg akarja tanulni, hogyan használhatja az SQL-t nagy adatok elemzésére. Akár adatelemző, diák, adatbázis-fejlesztő, könyvelő, üzleti elemző, adattudós vagy bárki más, akinek nagy adathalmazokból kell meglátásokat nyernie, ez a könyv megtanítja a munkához szükséges készségeket.
Tartalomjegyzék
1. Alapvető SQL-lekérdezések írása
2. Az adatok szűrése
3. Komplex szűrők alkalmazása lekérdezésekhez
4. Egyszerű számítások
5. Kimenet összesítése
6. Dátumokkal való munka a Databricksben
7. Szöveg formázása a lekérdezés kimenetében
8. Számok és dátumok formázása
9. Alapvető logika használata az elemzés javítására
10. Több táblázat használata az adatok lekérdezésekor
11. Haladó táblázat-összekötések használata
12. Al-lekérdezések
13. Levezetett táblák
14. Közös táblázatos kifejezések
15. Összefüggő részkérdések
16. Adatkészletek kezelése
17. Az SQL használata fejlettebb számításokhoz
18. Az adatok szegmentálása és osztályozása
19. Gördülő elemzés
20. Az adatok időbeli elemzése
21. Komplex adatkimenet
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)