鍍金池/ 問答/數據分析&挖掘/ (失信人)爬蟲問題:url中自動生成的srand字符怎么生成? 抓包和源碼都無法

(失信人)爬蟲問題:url中自動生成的srand字符怎么生成? 抓包和源碼都無法找到生成方法

問題描述

抓取的網站是:http://www.hljcredit.gov.cn/W...

源碼中

                <a href='WebCreditQueryService.do?sxbzxrQgDetail&dsname=hlj&dt=1&icautiouid=1230610007039893636&srandRe=J7137HK1408EJB2JQ9P05UF3949HWD'  style="text-decoration: underline;" target='_blank' title='陳滌非' style="">    

的url是如何生成的? 刷新頁面后這個url后面那個srandRe會隨機變化。 如果要訪問WebCreditQueryService.do?sxbzxrQgDetail&dsname=hlj&dt=1&icautiouid=1230610007039893636&srandRe=J7137HK1408EJB2JQ9P05UF3949HWD 這個連接,就需要帶上那個隨機參數, 我就想這個隨機數是如何生成的?

因為爬蟲的時候把這個url下抓取下來,但是過大概1分鐘這個連接就會過期,無法訪問。 所以我覺得這個隨機數是用來控制你瀏覽緩沖時間的。

問題出現(xiàn)的環(huán)境背景及自己嘗試過哪些方法

相關代碼

// 請把代碼文本粘貼到下方(請勿用圖片代替代碼)

你期待的結果是什么?實際看到的錯誤信息又是什么?

回答
編輯回答
孤島

都說了是rand了,說明是服務器自動生成的一個token,去掉以后會提示“勿惡意訪問和攻擊”,說明本身就是一個防護策略。

如果想要下次使用的話,我測試了一下,這個srandRe可以當場生成,和前面的id沒關系,需要使用的時候當場去抓一下列表頁取到這個srandRe然后拼到對應鏈接處即可

2017年6月2日 12:24