Értékelés:
A webkaparásról szóló könyv nagyrészt jó fogadtatásra talált, különösen a Python alapszintű ismereteivel rendelkezők körében. Dicsérik, hogy könnyen olvasható, informatív és jól strukturált. Megjegyzik azonban, hogy a könyv előzetes technikai ismereteket feltételez, ami kihívást jelent a teljesen kezdők számára. Néhány felhasználó csalódottságát fejezi ki a szövegben szereplő konkrét részletekkel és példákkal kapcsolatban is.
Előnyök:⬤ Könnyen olvasható
⬤ informatív
⬤ jól felépített szerkezet
⬤ alkalmas a Python alapszintű ismereteivel rendelkezők számára
⬤ gyakorlati útmutatás a különféle webkaparási alkalmazásokhoz
⬤ hasznos hivatkozásokat és kis kódpéldákat nyújt
⬤ sok olvasó hasznosnak találta projektjeihez.
⬤ Nem alkalmas teljesen kezdők számára, mivel feltételezi a Python és a webes technológiák előzetes ismeretét
⬤ egyes kódpéldák bonyolultak és nem eléggé magyarázottak
⬤ egyes témák elavultak vagy feleslegesek lehetnek
⬤ vegyes vélemények a különböző témák lefedettségének mélységéről.
(33 olvasói vélemény alapján)
Web Scraping with Python: Collecting More Data from the Modern Web
Ha a programozás varázslat, akkor a webkaparás bizonyára a varázslás egyik formája. Egy egyszerű automatizált program megírásával lekérdezhet webkiszolgálókat, adatokat kérhet, és elemezheti azokat, hogy kivonja a szükséges információkat. Ennek a gyakorlatias könyvnek a bővített kiadása nemcsak a webkaparással ismertet meg, hanem átfogó útmutatóként is szolgál a modern webről származó szinte mindenféle adat kaparásához.
Az I. rész a webkaparás mechanikájára összpontosít: a Python használatával információt kérhetünk egy webszerverről, elvégezhetjük a szerver válaszának alapvető kezelését, és automatizált módon léphetünk kapcsolatba a webhelyekkel. A II. rész számos specifikusabb eszközt és alkalmazást mutat be, amelyek minden olyan webes scraping forgatókönyvhöz illeszkednek, amellyel valószínűleg találkozhat.
⬤ Bonyolult HTML oldalak begyűjtése.
⬤ Lomtalanítók fejlesztése a Scrapy keretrendszerrel.
⬤ Tanuljon módszereket a lekapart adatok tárolására.
⬤ Adatok olvasása és kinyerése dokumentumokból.
⬤ Tisztítsa és normalizálja a rosszul formázott adatokat.
⬤ A természetes nyelvek olvasása és írása.
⬤ Formanyomtatványok és bejelentkezések átfésülése.
⬤ Javítsa ki a JavaScriptet és kússzon át az API-kon.
⬤ Kép-szöveg szoftverek használata és írása.
⬤ Kerülje el a kaparási csapdákat és a botblokkolókat.
⬤ Használja a scrapereket a webhely tesztelésére.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)