Adattisztítás

Értékelés:   (4.4 az 5-ből)

Adattisztítás (F. Ilyas Ihab)

Olvasói vélemények

Jelenleg nincsenek olvasói vélemények. Az értékelés 3 olvasói szavazat alapján történt.

Eredeti címe:

Data Cleaning

Könyv tartalma:

Az adatminőség az egyik legfontosabb probléma az adatkezelésben, mivel a piszkos adatok gyakran pontatlan adatelemzési eredményekhez és helytelen üzleti döntésekhez vezetnek.

A rossz adatok a vállalkozások és az amerikai kormányzat körében a jelentések szerint évente több trillió dollárba kerülnek. Több felmérés is azt mutatja, hogy a piszkos adatok a leggyakoribb akadály, amellyel az adattudósok szembesülnek. Nem meglepő, hogy a hatékony és eredményes adattisztítási megoldások kifejlesztése nagy kihívást jelent, és mély elméleti és mérnöki problémákat rejt magában.

Ez a könyv az adattisztításról szól, amely minden olyan feladatra és tevékenységre vonatkozik, amelynek célja az adatokban lévő hibák felderítése és javítása. Ahelyett, hogy egy adott adattisztítási feladatra összpontosítanánk, inkább áttekintést adunk a végponttól végpontig tartó adattisztítási folyamatról, leírva a különböző hibafelismerési és javítási módszereket, és megkíséreljük ezeket a javaslatokat többféle taxonómiával és nézettel lehorgonyozni. Konkrétan a négy leggyakoribb és legfontosabb adattisztítási feladatot tárgyaljuk, nevezetesen a kiugró értékek felismerését, az adatok átalakítását, a hibajavítást (beleértve a hiányzó értékek beillesztését) és az adatok deduplikálását. Továbbá a gépi tanulási technikák növekvő népszerűsége és alkalmazhatósága miatt egy olyan fejezetet is tartalmazunk, amely kifejezetten azt vizsgálja, hogy a gépi tanulási technikákat hogyan használják az adattisztításhoz, és hogyan használják az adattisztítást a gépi tanulási modellek javítására.

A könyv célja, hogy hasznos referenciaként szolgáljon az adatminőség és az adattisztítás iránt érdeklődő kutatók és szakemberek számára. Egy felsőfokú kurzus tankönyveként is használható. Bár célunk, hogy a legkorszerűbb algoritmusokat és technikákat tárgyaljuk, felismerjük, hogy az adattisztítás még mindig aktív kutatási terület, ezért adott esetben a kutatás jövőbeli irányait is megadjuk.

A könyv egyéb adatai:

ISBN:9781450371537
Szerző:
Kiadó:
Kötés:Puha kötés

Vásárlás:

Jelenleg kapható, készleten van.

A szerző további könyvei:

Adattisztítás - Data Cleaning
Az adatminőség az egyik legfontosabb probléma az adatkezelésben, mivel a piszkos adatok gyakran pontatlan adatelemzési eredményekhez és helytelen üzleti...
Adattisztítás - Data Cleaning

A szerző munkáit az alábbi kiadók adták ki:

© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)