response.text和response.content的區(qū)別
- response.text
類型:str
解碼類型:requests模塊自動根據(jù)http頭部對響應(yīng)的編碼做出推測,推測返回文本的編碼格式,如果使用這種方式接收,如果猜測錯誤會導(dǎo)致亂碼 - response.content
類型:bytes
解碼類型:沒有指定,我們接收到之后可以按照自己想要的方式進行轉(zhuǎn)換
例如:以下--test.py
import requests
url = 'http://www.baidu.com'
response = requests.get(url)
response.encoding = 'utf8'
print(response.text)
#第二種方式
url = 'http://www.baidu.com'
response = requests.get(url)
#不傳也行,默認就是utf-8
print(response.content.decode('utf-8'))
通過對response.content進行decode,來解決中文亂碼
- response.content.decode() 默認utf-8
- response.content.decode("gbk")
- 常見的編碼字符集
1.utf-8
2.gbk
3.ascii
4.iso-8859-1