爬蟲專案

爬蟲專案:破解極驗滑動驗證碼

一 介紹     一些網站會在正常的賬號密碼認證之外加一些驗證碼,以此來明確地區分人/機行為,從一定程度上達到反爬的效果,對於簡單的校驗碼Tesserocr就可以搞定,如下     但一些網站加入了滑動驗證碼,最典型的要屬於極驗滑動認證了,極驗官網:http://www.geetest.com/,下 […]

爬蟲專案(二)用phantomjs做爬蟲

這幾天有事沒怎麼研究,最開始用的java爬蟲想爬取攜程,結果失敗告終。 主要表現在: 1.抓取不到對應的標籤,jsoup語法對應的element個數是0,推測是因為直接用get方法獲取機票資訊時,該網站不顯示和價格資訊有關的elemengt,故抓取不到。 2.抓取到的資料是錯誤的。價格和真正標價的相 […]