鍍金池/ 問答/ 數(shù)據(jù)分析&挖掘問答
怪痞 回答

在表單里創(chuàng)建一個隱藏的input標(biāo)簽,然后將文檔的cookie拿出來,填入該標(biāo)簽,提交

雨蝶 回答

Arrays and pointers is different things.
You can do similar operator on them though, but these just syntax sugar.

Some link about this:
pointers-cppreference
arrays-cppreference
difference-between-array-and-pointer

薔薇花 回答

再隨機(jī)一次咯,直到隨機(jī)到有用的為止。

焚音 回答

你的點(diǎn)擊事件是加在"駕駛員"這個span標(biāo)簽上的

呆萌傻 回答

我猜你的文件時gbk編碼

pd.read_csv('data.csv',encoding='gbk')  #改成gbk編碼即可
款爺 回答

如果只是從列表中去掉的話

arr = map(lambda x:x.strip(),arr)
arr = [e for e in arr if e]

當(dāng)然得根據(jù)具體的需求,如果只是題主提供的那種字符串列表,這種方式就夠了

六扇門 回答

可用“工程名稱”,“招標(biāo)單位”等這些項(xiàng)目名稱作為前綴,再結(jié)合xpath搞定,相當(dāng)穩(wěn)定的。不論它怎么換位置,只要項(xiàng)目名稱不變,就能準(zhǔn)確提取項(xiàng)目內(nèi)容。

咕嚕嚕 回答

并不是每個代理IP都有效,你要先確認(rèn)代理是否有效再去使用

import requests
from pyquery import PyQuery as Q

headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}
proxies = {
    "http": "http://103.235.245.35:8080"
}

r = requests.get('http://hz.xiaozhu.com/', headers=headers, proxies=proxies)
for _ in Q(r.text)('#page_list li'):
    title = Q(_).find('.result_title').text()
    price = Q(_).find('.result_price').text()

    print title, price
離觴 回答

你的根目錄是指到public目錄下嗎?

離魂曲 回答

既然HTML inputnameimgs[],那curl也用這個就行了($data['imgs[]']=$file_obj),而不是搞個數(shù)組。

逗婦惱 回答

LinkExtractor這里面寫的不是正則寫的是你匹配的下一頁的url里面的東西LinkExtractor(r'/subject/d+/')

魚梓 回答

有的, 請見 ?getCRANmirrors

mirrors <- getCRANmirrors()
View(subset(mirrors, Country == "China"))
硬扛 回答
int[] 是object, 所以 a3 (int[])[] 可以賦給 object[] 
String 是object, 所以 a4 (String)[] 可以賦給 object[] 
但是, 基本類型 不是object, 所以 a1 (int)[] 不能賦給 object[] 
大濕胸 回答

你的變量$ceshi好像錯了我改了一下,不知道對不對

//錯誤的
$ceshi='優(yōu)酷視頻$$第1集$http://v.youku.com/$youku#第2集$http://v.youku.com/v_show$youku#第3集$http://v.youku.com/$$$芒果視頻$$第1集$http://vmguo.com$mgtv#第2集$http://v.mangguo.com$mgtv#第3集$http://v.mangguo.com$mgtv';

//我?guī)湍阈薷牧?,其中少?youku這一部分
$ceshi='優(yōu)酷視頻$$第1集$http://v.youku.com/$youku#第2集$http://v.youku.com/v_show$youku#第3集$http://v.youku.com/$youku$$$芒果視頻$$第1集$http://vmguo.com$mgtv#第2集$http://v.mangguo.com$mgtv#第3集$http://v.mangguo.com$mgtv';

$result_array = array();

$temp = explode('$$$',$ceshi);
//var_dump($temp);
foreach($temp as $key=>$value){

    $temp_array = (explode('$$',$value));
    //當(dāng)前的類別
    $category = $temp_array[0];
    //內(nèi)容再次進(jìn)行歸類
    $temp_array = explode('#',$temp_array[1]);
    foreach($temp_array as $key=>$value){
        
        //當(dāng)前的集數(shù)
        $temp_value = explode('$',$value);
        $ep_number = preg_replace('/(第)||(集)/','',$temp_value[0]);
        
        //需要壓入的數(shù)組
        $temp_result['siteSource']= $temp_value[2];
        $temp_result['siteName']= $category;
        $temp_result['siteLink']= $temp_value[1];
    
        //壓入結(jié)果數(shù)組
        $result_array["sitePerEpisode"][$ep_number][]=$temp_result;

    }
}

//$result_array為你要的結(jié)果,你可以var_dump看一下
//var_dump($result_array);

//將結(jié)果數(shù)組轉(zhuǎn)化為json,中文字符會被轉(zhuǎn)化
$json_result = json_encode($result_array,true);
echo $json_result;

未轉(zhuǎn)化為json的array結(jié)果

array(1) {
  ["sitePerEpisode"]=>
  array(3) {
    [1]=>
    array(2) {
      [0]=>
      array(3) {
        ["siteSource"]=>
        string(5) "youku"
        ["siteName"]=>
        string(12) "優(yōu)酷視頻"
        ["siteLink"]=>
        string(19) "http://v.youku.com/"
      }
      [1]=>
      array(3) {
        ["siteSource"]=>
        string(4) "mgtv"
        ["siteName"]=>
        string(12) "芒果視頻"
        ["siteLink"]=>
        string(16) "http://vmguo.com"
      }
    }
    [2]=>
    array(2) {
      [0]=>
      array(3) {
        ["siteSource"]=>
        string(5) "youku"
        ["siteName"]=>
        string(12) "優(yōu)酷視頻"
        ["siteLink"]=>
        string(25) "http://v.youku.com/v_show"
      }
      [1]=>
      array(3) {
        ["siteSource"]=>
        string(4) "mgtv"
        ["siteName"]=>
        string(12) "芒果視頻"
        ["siteLink"]=>
        string(20) "http://v.mangguo.com"
      }
    }
    [3]=>
    array(2) {
      [0]=>
      array(3) {
        ["siteSource"]=>
        string(5) "youku"
        ["siteName"]=>
        string(12) "優(yōu)酷視頻"
        ["siteLink"]=>
        string(19) "http://v.youku.com/"
      }
      [1]=>
      array(3) {
        ["siteSource"]=>
        string(4) "mgtv"
        ["siteName"]=>
        string(12) "芒果視頻"
        ["siteLink"]=>
        string(20) "http://v.mangguo.com"
      }
    }
  }
}
孤客 回答

就是一個array填充

import numpy as np

a = [[2, 9], [3, 6], [4, 7]]

res = np.array([1, 2, 3])

np.argmax(a, axis=1, out=res)

print(res)

命多硬 回答

你連xpath都能寫錯,我還能說什么?

萢萢糖 回答

就是分組求和的思想。

m = [[1,2017,2,5],[1,2018,1,5],[1,2018,2,4],[2,2017,1,5],[1,2018,1,2]]

# 先建立個dict,
# 前三項(xiàng)作為key, 第四項(xiàng)作為value
d = dict()
for i in m:
    d_key = tuple(i[:-1])
    d_value = i[-1]
    if d_key not in d:
        d.update({d_key:d_value})
    else:
        d[d_key] += d_value
        
 # 再把dict轉(zhuǎn)為數(shù)組
result = list()
for d_key,d_value in d.items():
    tmp = list(d_key)
    tmp.append(d_value)
    result.append(tmp)
print(result)   

result就是:

[[1, 2018, 2, 4], [1, 2018, 1, 7], [2, 2017, 1, 5], [1, 2017, 2, 5]]