鍍金池/ 問答/數(shù)據(jù)分析&挖掘  Python/ 爬蟲實(shí)現(xiàn)下載網(wǎng)頁(yè)源碼,css,js

爬蟲實(shí)現(xiàn)下載網(wǎng)頁(yè)源碼,css,js

怎么用python實(shí)現(xiàn)爬蟲實(shí)現(xiàn)下載網(wǎng)頁(yè)源碼,css,js文件,
就是把一些頁(yè)面或者整個(gè)網(wǎng)站扒下來,自己斷網(wǎng)都可以訪問
用python實(shí)現(xiàn)

回答
編輯回答
短嘆

你如果要斷網(wǎng)都可以訪問,對(duì)于動(dòng)態(tài)網(wǎng)站來說,那是不可能的。

2017年2月11日 03:05
編輯回答
祉小皓

首先,希望你要爬取的網(wǎng)站的反爬蟲技術(shù)比較落后,那么建議你看看這篇文章——使用 beautifulsoup 4 抓取網(wǎng)頁(yè)內(nèi)容實(shí)例
其次,如果爬取的網(wǎng)站用的js技術(shù)比較多,那么建議你用 selenium2 + phantomjs。
.....
如果你想爬取淘寶之類的網(wǎng)站,我也不會(huì),我曾經(jīng)爬取過,用了第二種方法,就高興了一分鐘,然后就爬取不到了。如果你有結(jié)果,記得告訴我一聲。

2018年6月13日 15:57