鍍金池/ 問答/數(shù)據(jù)分析&挖掘  Python/ 爬蟲相遇某些網(wǎng)站有時無法響應(yīng)的問題

爬蟲相遇某些網(wǎng)站有時無法響應(yīng)的問題

clipboard.png

如圖,我的爬蟲在抓取一個網(wǎng)站的時候,有時爬蟲能爬很深.有時候沒到一半就死掉了.
當(dāng)我檢查代碼的時候,發(fā)現(xiàn),我的代碼并沒有問題.他一再提示錯誤出自的是我的解析方式.
我從re,xpath,bs4這些解析庫度一個個試過了,都能正常匹配出那段數(shù)據(jù).但是就是出錯了...然后我的爬蟲就死掉了...

我的初步猜測是:

1.可能是訪問的頻率太快,而導(dǎo)致所加載的html頁面沒有完全被加載出來.
2.可能是網(wǎng)站的反扒系統(tǒng),識別出了我是爬蟲.然后故意給了我一個沒有頁面的,假的html.

我曾經(jīng)一度懷疑是不是我的代碼出了問題,但是我嘗試了很多次之后發(fā)現(xiàn)并不是.這就很郁悶了...

有遇到此問題的老鐵嗎???

回答
編輯回答
怣人

你這個是跑到最后一頁,沒有下一頁的鏈接所以提取不出來了吧。。。

2017年12月13日 08:17