鍍金池/ 問答/ 數(shù)據(jù)分析&挖掘問答
墨小白 回答

re.sub 第三個(gè)參數(shù)類型錯(cuò)誤,應(yīng)該改成

old_content = open('1.txt', 'rb').read()
new_content = re.sub(br'http://[^\s]+', b'', old_content)
來守候 回答

你確定是自己搭建的嗎?一般都是買的吧...
以商用為目的的爬蟲(比如爬xiecheng數(shù)據(jù))只靠幾臺(tái)服務(wù)器速度遠(yuǎn)遠(yuǎn)不夠,所以都是買大量的代理服務(wù)器地址(自己搭幾十個(gè)代理成本太高),即使其中被封了一部分也還有許多能用...
自己搭建要么是學(xué)習(xí)要么數(shù)據(jù)量小吧

生性 回答

肯定能隨機(jī)到0,但是2w次太少了,按double類型64位來計(jì)算,只有0的時(shí)候Math.ceil(Math.random()*10)的值才是0,所以概率是2的64次方分之1,你隨機(jī)2的64次方次,能得到0的期望是1,你隨機(jī)2w次的期望才是2的50次方分之一左右

需要先將$result結(jié)果使用$result = json_decode($result, true);解析為數(shù)組,之后再執(zhí)行如下操作

foreach($result['list'] as $mydata)
{
    echo $mydata['name'];
}
離觴 回答

browser.find_element_by_class_name('className').find_element_by_xpath('div')

厭惡我 回答
# 製造原 dataframe

from pandas import DataFrame

columns = ['data', 'id', 'key1']
d = {
    'data': [5, 10, 9, 8, 20],
    'id': [1, 2, 3, 4, 5],
    'key1': ['a', 'a', 'b', 'b', 'a']
}

dataframe = DataFrame(d, columns=columns)
# 利用 id_lst 製造新 dataframe

id_lst = [2, 3]
dataframe1 = dataframe[dataframe.id.isin(id_lst)]

我回答過的問題: Python-QA

野橘 回答

152..那個(gè)是時(shí)間戳,精確到毫秒的。
callback是jsonp跨域請(qǐng)求自動(dòng)生成的。你需要偽裝成一個(gè)jsonp的請(qǐng)求。
或者 你不帶callback試試,因?yàn)榭缬蛳拗浦辉跒g覽器。試一下它后端是否支持普通的API請(qǐng)求。

尤禮 回答

不要用賦初始值。redux數(shù)據(jù)盡量扁平化。但是需要。stat.key =null。每次用數(shù)據(jù)的時(shí)候用lodash判斷一下isPlainObject或者isArray。

擱淺 回答

你覺得你表達(dá)清楚了嗎?

少了REngine.jar這個(gè)jar包或者存在不同版本。

沒有代碼。只給思路。

  1. AOP
  2. Filter

補(bǔ)充

  1. 找找shiro標(biāo)簽。類似 <shiro:guest>
  2. 搜索下 spring 中是否配置了bean org.apache.shiro.spring.web.ShiroFilterFactoryBean 看看

log_df[['id','device']].groupby(['id'])['device'].apply(lambda x:len(set(x)))

尐潴豬 回答
import pandas as pd
#你的df有time索引,df.reset_index(False)去掉索引即可
df = pd.DataFrame([['2018-03-11 10:00:12', 1, 5], ['2018-03-11 20:00:12', 1, 5], ['2018-03-12 20:00:12', 1, 5]], columns=['date', 'a', 'b'])

def f(r):
    r['date'] = r['date'].split(' ')[0]    # 如果是日期類型直接r['date'] = r['date'].date()
    return r

df.apply(f, axis=1).groupby('date').sum()
孤星 回答

你的帳號(hào)需要付款

逗婦乳 回答

第一種 php5.5或更高版本

$array       = json_decode('[{"id":1,"name":"張三1"},{"id":2,"name":"張三2"},{"id":3,"name":"張三3"},{"id":4,"name":"張三4"},{"id":5,"name":"張三5"},{"id":6,"name":"張三6"},{"id":7,"name":"張三7"}]');
$arrayWithId = array_column($array, null, 'id');
$result      = $arrayWithId[3];
print_r($result);

第二種

你這是json數(shù)組,如果是php需要使用json_decode() 轉(zhuǎn)換為php數(shù)組,然后for循環(huán)

第三種

如是是js處理,3樓說的對(duì)

舊顏 回答

df["factor"] 這種語法可能返回值還是一個(gè) data.frame 而不是 vector

你可以嘗試使用這個(gè)語法:

 plot(expenditure, disposableincome,data = r)
下墜 回答

1、某個(gè) ip 短時(shí)間的大量的請(qǐng)求,就會(huì)封 ip,解決辦法,弄 ip 代理。
2、判斷請(qǐng)求間隔時(shí)間
3、弄些空白節(jié)點(diǎn),空白節(jié)點(diǎn)被獲取了就封。

浪婳 回答

向 map 這樣的高級(jí)遍歷函數(shù),內(nèi)部也是用 for 去循環(huán)的。

朕略傻 回答

你用read_csv的時(shí)候,加上skiprows 參數(shù),要求忽略第二行就好了啊。