鍍金池/ 問答/數(shù)據(jù)分析&挖掘  Java  Python  HTML/ python re庫(kù)的使用不理解

python re庫(kù)的使用不理解

剛接觸python不久,爬取頁(yè)面的時(shí)候需要使用正則,但是python的re庫(kù)看了半天很迷惑,可能是上了一天班都傻掉了==#
我有眾多的如下的url字符需要使用正則取得&pn之后的數(shù)字
http://www.qqddc.com/proIndex.do?method=index&thin=0&pb=168&pn=10
也需要用正則取到如下字符除了數(shù)字外
http://www.qqddc.com/proIndex.do?method=index&thin=0&pb=168&pn=
這樣的一串字符
在這里請(qǐng)教一下給位,多謝各位的指導(dǎo)~~謝謝

回答
編輯回答
何蘇葉

用正則不是太推薦, 建議用標(biāo)準(zhǔn)的urllib庫(kù)來完成

>>>import urllib
>>>a = urllib.parse.parse_qs(urllib.parse.urlparse("http://abc.com/def?x=2&pn=2").query)
>>>a
{'x': ['2'], 'pn': ['2']}

或者用下面的方式直接獲得dict

>>>a = dict(urllib.parse.parse_qsl(urllib.parse.urlparse("http://abc.com/def?x=2&pn=2").query))
>>>a
{'x': '2', 'pn': '2'}
2017年5月20日 00:36