鍍金池/ 問答/ 數(shù)據(jù)分析&挖掘問答
陌南塵 回答

有這么幾種可能

  • 百度統(tǒng)計(jì)沒有正確安裝,少統(tǒng)計(jì)某一種設(shè)備什么的
  • 百度統(tǒng)計(jì)本身不是實(shí)時(shí)的,對(duì)于你們來說有滯后
  • 用戶網(wǎng)絡(luò)狀況,手速太快等等原因?qū)е掳俣冉y(tǒng)計(jì)根本沒起作用

對(duì)了,還有種可能是這些沒被統(tǒng)計(jì)的注冊(cè)用戶都是機(jī)器人

乞許 回答

你這種情況需要用到無頭瀏覽器才行的。相當(dāng)于要等js執(zhí)行后,你再解析內(nèi)容。
如果是node來寫的話,可能比較方便,使用PhantomJS實(shí)現(xiàn)起來比較方便。

不過,java環(huán)境下的HtmlUnit兼容性稍弱,你可以試試看

未命名 回答

response 是返回的頭
request 是請(qǐng)求頭
爬蟲設(shè)置的是請(qǐng)求頭

久舊酒 回答

[自問自答] 我后來發(fā)現(xiàn)了,用chrome dev tool其實(shí)可以看到頁(yè)面本身請(qǐng)求數(shù)據(jù)時(shí)發(fā)送的appid/appkey,不過不是以這樣的param name呈現(xiàn)出來,所以一開始被我忽視了。實(shí)際上只要把這兩個(gè)鍵值對(duì)加進(jìn)header里,并加上chrome里看得到的payload信息,用requests發(fā)送POST請(qǐng)求,就可以直接調(diào)取數(shù)據(jù)庫(kù)信息了。

def f(df, col=1):
    return df[df['data2'] == max(df['data2'])]

df1 = df.groupby(['key1']).apply(f)
遲月 回答

如果你需要的數(shù)據(jù)在html的標(biāo)簽里,那就直接讀取這一段html標(biāo)簽咯。
你具體說一下“關(guān)鍵數(shù)值”是哪個(gè)東西

厭惡我 回答

利用:before,:after偽類進(jìn)行絕對(duì)定位,設(shè)置陰影,然后旋轉(zhuǎn),就可以模擬三角斜邊陰影了。
可以看下這個(gè)例子:三角陰影
其實(shí)不難,想清楚就行
這邊我另附一下box-shadow的用法吧
box-shadow

純妹 回答

下面是我寫的python,我編程比較差。。。求更好的方法

import itertools
def main():
    list1 = ['A', 'B', 'C', 'D','E']
    list2 = [1,2,3,4]
    result = itertools.permutations(list1, 4)
    newlist = []
    for item in result:
        newlist.append(list(item))
    newnewlist = []
    for item in newlist:
        item[0] = [list2[0],item[0]]
        item[1] = [list2[1], item[1]]
        item[2] = [list2[2], item[2]]
        item[3] = [list2[3], item[3]]
    for item in newlist:
        print(item)
if __name__ == '__main__':
    main()
久舊酒 回答

https://weibo.com/aj/mblog/fs...

沒錯(cuò)的話,獲取到的數(shù)據(jù)應(yīng)該是這條。最后多一句,對(duì)象要找對(duì),不然容易耽誤了一生。

情未了 回答

不需要解決。去看相應(yīng)版本的文檔,看如何處理解析問題。
(當(dāng)然,我看官方文檔,并沒有看到你說的,不包含 etree 的情況)

clipboard.png

妖妖 回答

1.如何抓取多個(gè)網(wǎng)站的文章?
答:不同的網(wǎng)站,意味著html結(jié)構(gòu)、分頁(yè)格式都會(huì)不一樣,只能針對(duì)不同的網(wǎng)頁(yè),寫不同的解析程序。
2.如何整理爬蟲信息?
答:你肯定是知道要抓取什么內(nèi)容的不是嗎?如標(biāo)題,內(nèi)容,作者等等,無非就是key-value,將值存在數(shù)據(jù)庫(kù)對(duì)應(yīng)的字段即可。

網(wǎng)妓 回答

答案來了。

const axios = require('axios')
// 下面代碼發(fā)送一個(gè)post請(qǐng)求到一個(gè)服務(wù)器
axios.post('驗(yàn)證驗(yàn)證碼的目標(biāo)url', {
    telephone: "17202345234" // 帶上手機(jī)號(hào)參數(shù)
  })
  .then(function (response) { // 后端處理成功,給你返回一個(gè)驗(yàn)證碼數(shù)據(jù),數(shù)據(jù)通過response讀取
    console.log(response.testnumber);
    return axios.post('獲取驗(yàn)證碼成功再發(fā)送一次請(qǐng)求的地址',{
        password: "我是密碼",
        telephone: "17202345234",
        noteinfo: "我是備注"
    })
  })
  .then(function(res){
    //完成注冊(cè)了
    console.log("注冊(cè)完成");
   })
  .catch(function (error) { // 如果請(qǐng)求失敗就走這里了
    console.log(error);
  });

沒有代碼。只給思路。

  1. AOP
  2. Filter

補(bǔ)充

  1. 找找shiro標(biāo)簽。類似 <shiro:guest>
  2. 搜索下 spring 中是否配置了bean org.apache.shiro.spring.web.ShiroFilterFactoryBean 看看
心悲涼 回答

頁(yè)面內(nèi)所展示的音頻和圖片本身就是開放的吧,只要你不去檢測(cè)權(quán)限展示給正常瀏覽用戶那樣還怎么防止哇,做水印或者音頻截取可以防止源文件拿去

痞性 回答

如果你是windows系統(tǒng)應(yīng)該看看環(huán)境變量是不是設(shè)置到了anaconda的目錄下
如果你是linux系統(tǒng)應(yīng)該看看是不是設(shè)置了軟鏈到anaconda的python

你的瞳 回答

先把你的那個(gè)counts轉(zhuǎn)換成字典,然后利用setdefault這個(gè)方法。

a_dict = {
    "包" : 3,
    "李" : 3,
    "王" : 2,
    "張" : 2,
    "曹" : 2,
}

result = {}
for k, v in a_dict.items():
    result.setdefault(v, []).append(k)

print(result)

>>> {3: ['包', '李'], 2: ['王', '張', '曹']}
情殺 回答

你只能確定你需要的是哪個(gè)包的REXP,然后將另一個(gè)import刪掉了.
我不信你一個(gè)類里兩個(gè)REXP都需要用,真用的話建議將代碼分割為兩個(gè)類.

薔薇花 回答

其實(shí)直接

print(p1);

就可以