鍍金池/ 問(wèn)答/數(shù)據(jù)分析&挖掘  Python/ 爬取馬蜂窩首頁(yè)的熱門(mén)游記遇到分頁(yè)請(qǐng)求參數(shù)的問(wèn)題?

爬取馬蜂窩首頁(yè)的熱門(mén)游記遇到分頁(yè)請(qǐng)求參數(shù)的問(wèn)題?

第一次寫(xiě)爬蟲(chóng)想爬取馬蜂窩首頁(yè)上的游記,遇到一點(diǎn)問(wèn)題。
如下圖1.1想主要爬取首頁(yè)上的熱門(mén)游記。
clipboard.png
圖1.1

通過(guò)Chrome控制臺(tái)得到了異步加載的頁(yè)面的地址,這里沒(méi)主要需要一個(gè)兩個(gè)參數(shù),一個(gè)是 page的頁(yè)數(shù),另外一個(gè)是152開(kāi)頭的一串?dāng)?shù)字,page的頁(yè)面是有規(guī)律的,問(wèn)題在于后面的參數(shù),沒(méi)有發(fā)現(xiàn)可以尋跡的規(guī)律。
clipboard.png
圖1.2

猜想是在js中隨機(jī)生成的,在event的代碼中也沒(méi)有找到對(duì)應(yīng)的代碼。
clipboard.png
圖1.3

基本到這里卡住了,關(guān)于獲取152開(kāi)頭的數(shù)字有沒(méi)有其他方式呢?

回答
編輯回答
野橘

152..那個(gè)是時(shí)間戳,精確到毫秒的。
callback是jsonp跨域請(qǐng)求自動(dòng)生成的。你需要偽裝成一個(gè)jsonp的請(qǐng)求。
或者 你不帶callback試試,因?yàn)榭缬蛳拗浦辉跒g覽器。試一下它后端是否支持普通的API請(qǐng)求。

2017年1月28日 02:45
編輯回答
旖襯

你好,我是個(gè)外行,做旅游的,我想問(wèn)下您是可以通過(guò)這種方式讓馬蜂窩游記上熱門(mén)嗎

2017年9月1日 09:29
編輯回答
雅痞

這個(gè)應(yīng)該是個(gè)時(shí)間戳

2018年2月2日 10:40
編輯回答
假灑脫
import time

base_url = ''
url = '{}&_={}'.format(base_url, int(time.time()*1000))

不加一般應(yīng)該也是可以的。

2017年11月10日 09:34