很多時(shí)候,在得到搜索結(jié)果之后,我們需要更深入地搜索現(xiàn)有搜索結(jié)果的一部分。 例如,在給定的文本主體中,我們的目標(biāo)是獲取Web地址,并提取Web地址的不同部分,如協(xié)議,域名等。在這種情況下,需要借助用于劃分的組功能 搜索結(jié)果以各個(gè)組為基礎(chǔ),分配正則表達(dá)式。 我們通過使用可搜索部分周圍的括號(hào)分隔主搜索結(jié)果來創(chuàng)建這樣的組表達(dá)式,不包括想要匹配的固定單詞。
import re
text = "The web address is https://www.yiibai.com"
# Taking "://" and "." to separate the groups
result = re.search('([\w.-]+)://([\w.-]+)\.([\w.-]+)', text)
if result :
print "The main web Address: ",result.group()
print "The protocol: ",result.group(1)
print "The doman name: ",result.group(2)
print "The TLD: ",result.group(3)
執(zhí)行上面的示例代碼,得到以下結(jié)果 -
The main web Address: https://www.yiibai.com
The protocol: https
The doman name: www.yiibai
The TLD: com