鍍金池/ 問答/ 數(shù)據(jù)分析&挖掘問答
瘋浪 回答

這是科學(xué)計數(shù)法

clipboard.png

清夢 回答

使用 mutate(df,lubridate::ymd_hms(ts))

萌小萌 回答

php 版本問題 5.4 以上才支持短數(shù)組寫法

php 5.4

莫小染 回答

直接用 瀏覽器離線模式吧,沒有必要寫爬蟲

選擇 回答

1.是你里面var.csv 前的斜杠反了
2.如果不行,嘗試在引號前加個r, 表示轉(zhuǎn)義。

心上人 回答
$arr = $arr['data'];

$arr1 = array_filter($arr, function ($item){
    return $item['symbol'] == 'BTC';
});
var_dump($arr1);
貓館 回答

我不是很理解你這個有效封裝具體指的是什么?

你想問的是如何數(shù)組去重嗎?

失心人 回答

這得看具體代碼實現(xiàn)了吧,深度優(yōu)先只規(guī)定了往沉挖,沒規(guī)定同級別的節(jié)點間怎么排序。

熟稔 回答

sf_remember在cookie里面,而且不是httpOnly的,js可以讀到

風(fēng)畔 回答
import pandas as pd
threedays = ['2018/3/9', '2018/3/10', '2018/3/11']
df = pd.read_csv('test.csv')
df = df[df['data_date'].isin(threedays)].groupby(['data_date', 'product_id']).sum().reset_index(drop=False) # 過濾最近三天并求和

def f(df):
    if len(df) == 3:
        # 三天都有數(shù)
        r = [df['uv'][df['data_date'] == threedays[i]].values[0] for i in range(3)]
        return (r[2] - r[1] < 100) and r[2] > r[1] and (r[1] - r[0] < 100) and r[1] > r[0] #增長大于0小于100
    else:
        return False

r = df.groupby('product_id').apply(f)
print(list(r[r==True].index))

條件2類比,把f改一下就ok了

乖乖噠 回答

換元 t = ts * z 后,會發(fā)現(xiàn)積分其實是個Beta函數(shù)。

$$ \array{ \text{原式} &=& \fracfbpbfnn{t_s}(1-\frac{x_s^2}{a^2})^{(\beta_x-1)} \int_{0}^{1} \! \left[1-\frac{(t_s z-t_s/2)^2}{(t_s/2)^2}\right]^{\beta_y-1} t_s\,\mathrmbzlxh3r z\\ &=& d\, (1-\frac{x_s^2}{a^2})^{(\beta_x-1)} \int_{0}^{1} \! [1-(2z-1)^2]^{\beta_y-1}\,\mathrmvtdpbvx z\\ &=& 4^{(\beta_y-1)}\, d\, (1-\frac{x_s^2}{a^2})^{(\beta_x-1)}\, \int_{0}^{1} \! z^{\beta_y-1} (1-z)^{\beta_y-1}\,\mathrmvzfrjrr z\\ &=& 4^{(\beta_y-1)}\, d\, \mathrm{Beta}(\beta_y, \beta_y)\, (1-\frac{x_s^2}{a^2})^{(\beta_x-1)} } $$

詆毀你 回答
import requests
r = requests.get(url1)  # 你第一次的url
headers = {
    'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
    'Accept-Encoding':'gzip, deflate, sdch',
    'Accept-Language':'zh-CN,zh;q=0.8',
    'Connection':'keep-alive',
    'Cache-Control':'no-cache',
    'Content-Length':'6',
    'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',
    'Host':'www.mm131.com',
    'Pragma':'no-cache',
    'Origin':'http://www.mm131.com/xinggan/',
    'Upgrade-Insecure-Requests':'1',
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36',
    'X-Requested-With':'XMLHttpRequest'
}  # headers的例子,看你的post的headers
headers['cookie'] = ';'.join([headers['cookie'], ['='.join(i) for i in r.cookies.items()]])
r = requests.post(url2, headers=headers, data=data)  # 你第二次的url
尋仙 回答

搜索建議結(jié)果是用js動態(tài)生成的.
可以直接觀察它是向哪個 api 請求的.
比如搜索hello, 可以直接請求
https://finance.yahoo.com/_finance_doubledown/api/resource/searchassist;searchTerm=hello
那么代碼可以這樣寫:

import json
import requests

kw = 'hello'
url_base = 'https://finance.yahoo.com/_finance_doubledown/api/resource/searchassist;searchTerm='
url = url_base + kw
resp = requests.get(url)
print(json.dumps(json.loads(resp.text), indent=4, sort_keys=True))

得到類似的結(jié)果:

{
    "hiConf": false,
    "items": [
        {
            "exch": "FRA",
            "exchDisp": "Frankfurt",
            "name": "HelloFresh SE",
            "symbol": "HFG.F",
            "type": "S",
            "typeDisp": "Equity"
        },
        ...

我嘗試的貌似直接請求即可, 尚不知 yahoo 有沒有限制請求的措施.

未命名 回答

response 是返回的頭
request 是請求頭
爬蟲設(shè)置的是請求頭

陪妳哭 回答

這個你應(yīng)該找爬蟲來做,而不是js。爬蟲是專門做這種事情的,花個上萬月薪請一個python工程師吧。股票網(wǎng)站是屬于非常難爬的類型網(wǎng)站。

若相惜 回答

登錄接口里不需要參數(shù)signature。
密碼是md5加密的。
"""
g = 'veenike';
c.isValidate && (c.password = md5(c.password), c.password = md5(g + c.password + g)
"""
先對你輸入的密碼md5加密,得到的字符串首尾再增加個veenike,得到的新字符串再md5。

薔薇花 回答

ES7環(huán)境

b = a.reduce((origin, next) => origin.concat(next), []).reduce((origin, next) => {
    let index = origin.findIndex(item => item.some(element => element.id === next.id));
    index >= 0 ? origin[index].push(next) : origin.push([next]);
    return origin;
}, []);

Lodash

let b = _.flatten(a).reduce((origin, next) => {
    let index = _.findIndex(origin, item => item.some(element => element.id === next.id));
    index >= 0 ? origin[index].push(next) : origin.push([next]);
    return origin;
}, []);
淡墨 回答

最好不要使用for循環(huán)。

df1['group'] = df1['add'].apply(lambda x: df2.loc[[y in x for y in df2['key_word']],'group']).stack().reset_index(name='group')['group']

更新:
另一種方法,處理未收錄的情況

def match_group(x):
    for y in df2['key_word']:
        if y in x:
            return y
    return '未收錄'

df1['group'] = df1['add'].apply(match_group)
悶騷型 回答

別用phantomjs了,現(xiàn)在chrome都支持headless了,p的作者自己都說不建議使用了。
puppeteer和selenium有很多選擇的。