
Data Wrangling: Concepts, Applications and Tools
DATA WRANGLING
Ez az izgalmas új kötet, amelyet a világ legjobb szakértői írtak és szerkesztettek, a legmodernebb kutatásokat és a legújabb technológiai áttöréseket mutatja be az adatfeldolgozás, az elméleti koncepciók, a gyakorlati alkalmazások és a mindennapi problémák megoldására szolgáló eszközök terén.
Az adatfeldolgozás a rendezetlen és összetett adathalmazok tisztításának és egységesítésének folyamata a könnyű hozzáférés és elemzés érdekében. Ez a folyamat jellemzően magában foglalja az adatok kézi átalakítását és leképezését egy nyers formából egy másik formátumba, hogy lehetővé tegye az adatok kényelmesebb felhasználását és szervezését. Az adatfeldolgozás egyre inkább mindenütt jelen van a mai vezető cégeknél.
Az adattisztítás a pontatlan adatok eltávolítására összpontosít az adathalmazból, míg az adattisztítás az adatok formátumának átalakítására összpontosít, jellemzően a "nyers" adatok más, felhasználásra alkalmasabb formátumba történő átalakításával. Az adattisztítás minden vállalkozás szükséges eleme. Az adatkezelési megoldásokat kifejezetten úgy tervezték és architektúrázták, hogy bármilyen léptékű, változatos, összetett adatokat kezeljenek, beleértve számos alkalmazást, például a Datameer, az Infogix, a Paxata, a Talend, a Tamr, a TMMData és a Trifacta.
Ez a könyv átfogó áttekintéssé szintetizálja az adatfeldolgozás folyamatait, nagy hangsúlyt fektetve az adatvezérelt vállalatok legújabb és gyorsan fejlődő agilis analitikai folyamataira, hogy a vállalkozások és más vállalkozások segítségével megoldást találjanak mindennapi problémáikra és gyakorlati alkalmazásaikra. Legyen szó veterán mérnökről, tudósról vagy más ipari szakemberről, ez a könyv minden könyvtárban kötelező darab.