鍍金池/ 問答/數(shù)據(jù)分析&挖掘  Python  網(wǎng)絡安全  HTML/ python3中如何將utf-8的編碼轉化為正常的字符串

python3中如何將utf-8的編碼轉化為正常的字符串

在寫python爬蟲的時候(python3),在網(wǎng)頁中獲取的字符串是utf-8編碼的:
clipboard.png
請問如何將這些utf-8編碼轉換為看得懂的字符串?

我有想過用decode函數(shù),但只有bytes類型才能調用decode函數(shù),我這里的一串編碼實際上還是string類型的。

比如:

#這種是沒有問題的
mystery = b"\xe5\x88\xab"
x = mystery.decode('utf-8')
#這種則會報錯
mystery = "\xe5\x88\xab"
x = mystery.decode('utf-8')
回答
編輯回答
練命

別怪我啰嗦,深深的刺痛你。

data = b'你所拿到的全部數(shù)據(jù)'

也就是說,把你的全部數(shù)據(jù)都納入 b'' 中。如果涉及到換行問題,請自行用 Python 來處理即可。

2017年7月10日 20:18
編輯回答
乞許

爬蟲從網(wǎng)頁里拿到的應該是r"xe5x88xab"?

>>> mystery = r"\xe5\x88\xab"
>>> x = bytearray.fromhex(''.join(mystery.split("\\x"))).decode()
>>> print(x)
別
2017年1月23日 18:24