
Noise Filtering for Big Data Analytics
Ez a könyv elmagyarázza, hogyan lehet az adatok zajmentesítését nagy léptékben, kielégítő pontossággal elvégezni. Három fő kérdéssel foglalkozik.
Először is, hogyan lehet kiküszöbölni a hiba terjedését az egyik szakaszból a következő szakaszokba a szűrt modell kialakítása során. Másodszor, hogyan lehet megtartani az adatok helyzeti jelentőségét a tisztítás során. Végül pedig az adatok memóriájának megőrzése kulcsfontosságú ahhoz, hogy a zajos nagy adatokból intelligens adatokat lehessen kinyerni.
Ha a simítás vagy szűrés bármely formájának alkalmazása után a megfelelő adatok memóriája erősen megváltozik, akkor a végső adatok elveszíthetnek néhány fontos információt. Ez téves vagy hibás következtetésekhez vezethet.
De ha előre látjuk, hogy a simítás vagy szűrés miatt bármilyen információvesztés következik be, nem kerülhetjük el a zajmentesítés folyamatát, mivel másrészt a nagy adatok bármilyen elemzése zaj jelenlétében félrevezető lehet. Tehát az egész folyamat nagyon gondos végrehajtást igényel hatékony és intelligens modellekkel, hogy hatékonyan kezelhessük.