鍍金池/ 問(wèn)答/ 數據分析&挖掘問(wèn)答
離觴 回答

clipboard.png
可以通過(guò)捉包得出, 登錄url 不是https://passport.csdn.net/acc...
而是這個(gè)https://passport.csdn.net/acc...
session.post(url,data=post_data, headers=headers)
中的url 改回 https://passport.csdn.net/acc... 就可以登錄

風(fēng)畔 回答

1、要怎麼讓他以 名稱(chēng)1, 名稱(chēng)2, 名稱(chēng)3.... 排列?
在寫(xiě)sql語(yǔ)句的時(shí)候,寫(xiě)上

order by 字段名稱(chēng) asc

2、把這個(gè)數據丟到某個(gè)全局變數?
全局變量一般以global關(guān)鍵字來(lái)聲明,具體可以參考這里
https://www.cnblogs.com/Striv...

慢半拍 回答

設置一個(gè)map = {}
遍歷fData
合并map[ownerName]信息
最后把map轉成數組就好了

硬扛 回答
重在怎么在控制臺里使用js發(fā)送請求,獲取數據?控制臺不能使用jQuery還有其他第三方庫吧?那么請求怎么發(fā)送呢

可以用 jQuery ,只要頁(yè)面有引入。
否則,你就自己 new XMLHttpRequest 就好了,自己查這個(gè) API 的文檔吧。

菊外人 回答

You can match other attributes like id or class, src.

久舊酒 回答

你要定位的標簽應該是通過(guò)js通過(guò)異步來(lái)生成的,所以沒(méi)法定位,等一段時(shí)間試試

孤星 回答

假設你的這段html代碼命名為s

from bs4 import BeautifulSoup

soup = BeautifulSoup(s, "lxml")  
table = soup.find("table", {"class", "mod_table"})  # 獲得table,用class來(lái)限制唯一性
trs = table.find_all("tr")[1:-1]  # 獲得table內的各行,去除表頭(第一行)和頁(yè)碼(最后一行)
result = [tr.find_all("td")[4] for tr in trs]  # 獲得每個(gè)tr里的所有td中的第5個(gè)(目標)

獲取html上的元素一般都可以用這種方法。

兔囡囡 回答

下載的SDK文件中的config配置參數沒(méi)有改,改成自己的微信參數就OK了

孤影 回答

為提升性能,應減少 pandas.DataFrame.apply() 的逐行操作,在本例中可改用 numpy.where() 二元操作符,如下

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: df1 = pd.DataFrame({'t': [1,2,3], 'user_id': [10,20,30], 'v': [1.1,2.2,3.3]})

In [4]: df1
Out[4]: 
   t  user_id    v
0  1       10  1.1
1  2       20  2.2
2  3       30  3.3

In [5]: df2 = pd.DataFrame({'t': [4,1,2], 'user_id': [40,10,20], 'v': [400,100,200]})

In [6]: df2
Out[6]: 
   t  user_id    v
0  4       40  400
1  1       10  100
2  2       20  200

In [7]: df3 = pd.merge(df1, df2, how='right', on=['t', 'user_id'])

In [8]: df3
Out[8]: 
   t  user_id  v_x  v_y
0  1       10  1.1  100
1  2       20  2.2  200
2  4       40  NaN  400

In [9]: df3['v'] = np.where(np.isnan(df3.v_x), df3.v_y, df3.v_x)

In [10]: df3
Out[10]: 
   t  user_id  v_x  v_y      v
0  1       10  1.1  100    1.1
1  2       20  2.2  200    2.2
2  4       40  NaN  400  400.0

In [11]: del df3['v_x']

In [12]: del df3['v_y']

In [13]: df3
Out[13]: 
   t  user_id      v
0  1       10    1.1
1  2       20    2.2
2  4       40  400.0
敢試 回答

爬取頁(yè)面信息,對獲取的數據進(jìn)行過(guò)濾,篩選,排序等操作,通過(guò)一定的算法,把整理后的數據展示給用戶(hù)。
至于具體怎么個(gè)智能解析,外人哪里知道。

愿如初 回答

一篇不錯的反爬蟲(chóng)技術(shù)方案博文:https://github.com/FantasticL...

伴謊 回答
pd.concat(frames, axis=1, join_axes=[A.index])

而不是 'A'.index, 加單引號表示其為字符串了。

茍活 回答

可能是抓錯了?微博抓包的話(huà)建議用瀏覽器打開(kāi)移動(dòng)端的鏈接,直接用m.weibo.com登錄就行了,那個(gè)接口很好用。

首頁(yè) 上一頁(yè) 1 2 3 4 5 6 7 8 下一頁(yè) 尾頁(yè)