Értékelés:
A webkaparásról szóló könyv nagyrészt negatív kritikákat kapott, a felhasználók csalódottságuknak adtak hangot a mélység és a gyakorlati útmutatás hiánya miatt. Néhányan úgy találták, hogy hasznosabb, ha inkább az online forrásokból, például a YouTube-ból és a Stack Overflowból kérnek segítséget.
Előnyök:Néhány felhasználó úgy találta, hogy a könyv alapvető ismereteket nyújthat a különböző kaparási könyvtárakról, és hasznos lehet azoknak a felhasználóknak, akiket inkább a kúszás, mint az ismert webhelyek kaparása érdekel.
Hátrányok:A könyv nem nyújt elegendő részletességet a gyakorlati alkalmazáshoz, különösen a kezdők/közvetítők számára. Hiányoznak belőle az olyan alapvető témák, mint a jelszavak és a JavaScript kezelése. Sokan nem találták megfelelőnek, és azt javasolták, hogy az online források sokkal hatékonyabbak.
(3 olvasói vélemény alapján)
Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS
Oldja meg a webes adatgyűjtés bonyolultságát, és könnyedén hozzáférhet webes adatokhoz Python szkriptek segítségével
Főbb jellemzők
⬤ Kézzelfogható receptek a webkaparási készségek szakértői szintre való fejlesztéséhez.
⬤ Egyablakos megoldási útmutató az összetett és kihívást jelentő webkaparási feladatok megoldásához Python segítségével.
⬤ A weboldalak struktúrájának megértése és adatok gyűjtése egy weboldalról könnyedén.
Könyv leírása
A Python Web Scraping szakácskönyv egy megoldásközpontú könyv, amely megtanítja a nagy teljesítményű kaparók fejlesztésének technikáit, valamint a lánctalpasok, sitemapok, űrlap-automatizálás, Ajax-alapú oldalak, gyorsítótárak és sok más dolog kezelését.
Számos valós forgatókönyvet fogsz megvizsgálni, amelyekben a fejlesztési/termék életciklus minden része teljes mértékben le lesz fedve. Nemcsak a megbízható teljesítményű adatfolyamok megtervezéséhez és fejlesztéséhez szükséges készségeket fejleszti, hanem a kódbázis AWS-re történő telepítését is. Ha szoftverfejlesztéssel, termékfejlesztéssel vagy adatbányászattal foglalkozik (vagy érdekli az adatvezérelt termékek építése), hasznosnak fogja találni ezt a könyvet, mivel minden receptnek világos célja és célkitűzése van. A weboldalakból történő adatnyeréstől kezdve a kifinomult webkúszó program megírásáig a könyv független receptjei istenáldotta segítséget jelentenek majd. Ez a könyv a Python könyvtárakkal, a kérésekkel és a BeautifulSouppal foglalkozik. Megtanulhat a kúszásról, a webpókolásról, az Ajax weboldalakkal való munkáról, a paginált elemekről és még sok másról. Megtanulja továbbá kezelni az olyan problémákat, mint a 403-as hibák, a proxyval való munka, a képek kaparása és az LXML.
A könyv végére Ön képes lesz a weboldalak hatékonyabb feltérképezésére, és képes lesz.
Telepítse és működtesse a kaparóját a felhőben.
Amit megtanulhat
⬤ Változatos eszközök használata bármilyen weboldal és adat lekaparásához, beleértve a BeautifulSoup, Scrapy, Selenium és sok más eszközt.
⬤ Mester kifejezési nyelvek, például XPath és CSS, valamint szabályos kifejezések webes adatok kinyerésére.
⬤ Birkózzon meg az olyan csapdákkal, mint a rejtett űrlapmezők, a fojtás, a lapozás és a különböző státuszkódok.
⬤ Biztonságos kaparási csővezetékek építése SQS és RabbitMQ segítségével.
⬤ Kaparjon le olyan eszközöket, mint a képmédia, és tanulja meg, mit tegyen, ha a Scraper nem fut.
⬤ Tudja meg az ETL technikákat egy testreszabott lánctalpas, elemző építésére és a strukturált és strukturálatlan adatok konvertálására a webhelyekről.
⬤ Telepítse és futtassa a scraperét szolgáltatásként az AWS Elastic Container Service-ben.
Kinek szól ez a könyv
Ez a könyv ideális Python-programozóknak, webes rendszergazdáknak, biztonsági szakembereknek és mindenkinek, aki webanalitikát szeretne végezni. A Python nyelv ismerete és a webkaparás alapvető megértése hasznos lesz ahhoz, hogy a lehető legtöbbet hozza ki ebből a könyvből.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)