学科分类
目录
网络爬虫

返回响应

Response类用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生成响应,包括状态码、网页的内容等。接下来,通过一张表来列举Response类包含的信息,如表1所示。

表1 Response类的常用属性

属性 说明
status_code HTTP请求的返回状态,200表示连接成功,404表示失败
text HTTP响应内容的字符串形式,即URL对应的页面内容
encoding 从HTTP请求头中猜测的响应内容编码方式
apparent_encoding 从内容中分析出的响应编码的方式(备选编码方式)
content HTTP响应内容的二进制形式

Response类会自动解码来自服务器的内容,并且大多数的Unicode字符集都可以被无缝地解码。

当请求发出之后,Requests库会基于HTTP 头部信息对响应的编码作出有根据的判断。例如,在使用 response. text (response为响应对象)时,可以使用判断的文本编码。此外,还可以找出Requests库使用了什么编码,并且可以设置encoding 属性进行改变,示例如下:

>>> response.encoding
'utf-8'
>>> response.encoding = 'ISO-8859-1'

再次调用text属性获取返回的文本内容时,将会使用上述设置的新的编码方式。

点击此处
隐藏目录