03 响应状态码

03 响应状态码收录于话题#网络爬虫3.1 响应状态码共分为5种类型3.1.1 1xx(临时响应)3.1.2 2xx (成功)3.1.3 3xx (重定向)3.1.4 4xx (请求错误)3.1.5

03 响应状态码

包含在主题中

#网络爬虫

3.1 响应状态码分为五类。

3.1.1 1xx(临时支持)

3.1.2 2xx(成功)

3.1.3 3xx(重定向)

3.1.4 4xx(请求错误)

3.1.5 5xx(服务器错误)

3.2 一些常见的响应状态码

3.3 实践练习

3.3.1 访问百度网页。

3.3.2 访问豆瓣电影首页

3.3.3 访问知乎首页

3.4 概述

3.1 响应状态码分为五类。 4_. 响应状态码3.1.1 1xx(临时响应) 1xx(临时响应):表示临时响应并请求请求者继续操作的状态码。

100(继续)请求者必须继续请求。服务器返回此代码表示它已收到请求的第一部分并正在等待其余部分。

101(协议切换)请求者请求服务器切换协议,服务器确认并准备切换。

3.1.2 2xx(成功)返回码2xx(成功):表示请求已成功处理的状态码。

200(成功)服务器成功处理请求。通常,这意味着服务器提供了所请求的网页。

201(创建)请求成功,服务器创建了新资源。

202(已接受) 服务器已接受请求,但尚未处理。

203(错误信息)服务器成功处理了请求,但返回的信息可能来自其他来源。

204(No Content)服务器成功处理了请求,但没有返回任何内容。

205(重置内容)服务器成功处理了请求,但没有返回任何内容。

206(部分)服务器成功处理了部分GET 请求。

3.1.3 3xx(重定向) 返回代码3xx(重定向):表示需要采取进一步操作才能完成请求。

300(多项选择)服务器可以执行各种操作来响应请求。服务器可以根据请求者(用户代理)选择一个操作,也可以提供一个操作列表供请求者选择。

301(永久移动)请求的网页已永久移动到新位置。当服务器返回此响应(响应GET 或HEAD 请求)时,它会自动将请求者重定向到新位置。

302(临时移动)服务器当前正在响应来自不同位置的网页的请求,但请求者应继续使用原始位置来处理将来的请求。

303(在别处显示)当请求者需要使用单独的GET 请求到另一个位置来获取响应时,服务器返回此代码。

304 (Unmodified) 所请求的网页自上次请求以来尚未被修改。服务器返回此响应时,不会返回任何网页内容。

305(使用代理)请求者只能使用代理访问所请求的网页。如果服务器返回此响应,也表明请求者应该使用代理。

307(临时重定向)服务器当前正在响应来自另一个位置的网页的请求,但请求者应继续使用原始位置来处理将来的请求。

3.1.4 4xx(请求错误)返回代码4xx(请求错误):这些状态代码表明请求失败,服务器可能无法处理该请求。

400(错误请求)服务器无法理解请求的语法。

401(错误)请求需要身份验证。对于需要登录的网页,服务器可能会返回此响应。

403(禁止)服务器拒绝请求。

404(Not Found)服务器找不到所请求的网页。

405(方法无效)禁用请求中指定的方法。

406(不接受)请求的网页无法响应请求的内容属性。

407(需要代理授权)此状态代码类似于401(未经授权),但指定请求者必须获得授权才能使用代理。

408(请求超时)服务器等待请求时发生超时。

409(冲突)服务器在完成请求时检测到冲突。服务器必须在响应中包含有关冲突的信息。

410(已删除)如果请求的资源已被永久删除,服务器返回此响应。

411(需要有效长度)服务器不会接受没有有效内容长度标头字段的请求。

412(Precondition not met)服务器不满足请求者在请求中设置的前提条件之一。

413(请求实体太大)服务器无法处理请求,因为请求实体太大,服务器无法处理。

414(请求的URI 太长)请求的URI(通常是URL)太长,服务器无法处理。

415(不支持的媒体类型)请求的页面不支持请求的格式。

416(请求的范围不满足要求)当页面无法提供请求的范围时,服务器返回此状态码。

417(Expectation Not Met) 服务器不满足“Expectations”请求头字段的要求。 418 有反爬虫机制。访问的URL有反爬虫机制,解决方案是使用请求头(suser-agent)来访问。

3.1.5 5xx(服务器错误)返回代码5xx(服务器错误):这些状态代码表示服务器在尝试处理请求时遇到内部错误。

这些错误可能是服务器本身的错误,而不是请求中的错误。

500(内部服务器错误)服务器遇到错误,无法完成您的请求。

501(未实现)服务器没有能力完成请求。例如,如果服务器无法识别请求方法,则可能会返回此代码。

502(错误网关)充当网关或代理的服务器从上游服务器收到无效响应。

503(服务不可用)服务器当前不可用(由于过载或维护停机)。这通常是暂时的情况。

504(网关超时) 服务器作为网关或代理,但没有及时收到上游服务器的请求。

505(HTTP 版本不支持) 服务器不支持请求中使用的HTTP 协议版本。

3.2 一些常见的响应状态码200 – 服务器成功返回网页。

404 – 请求的网页不存在

503服务不可用

3.3 实战练习3.3.1 访问百度网页#导入访问网页所用的库

导入请求

#声明一个变量来存储URL

#URL 是一个字符串变量。 URL 前后需要加引号。

url=’https://www.baidu.com/’

使用#requests.get(website) 访问网页

#库名称(访问的URL)

打印(请求.get(url))

#type() 函数检查requests.get() 函数返回的结果的类型。

打印(类型(requests.get(url)))

[终端输出]

回应[200]

类“requests.models.Response”requests.get() 函数返回响应[200]。

响应状态代码200 表示服务器已成功处理请求。

3.3.2 访问豆瓣电影首页#导入访问网页所用的库

导入请求

#声明一个变量来存储URL

#URL 是一个字符串变量。 URL 前后需要加引号。

url=’https://movie.douban.com’

使用#requests.get(website) 访问网页

#库名称(访问的URL)

打印(请求.get(url))

#type() 函数检查requests.get() 函数返回的结果的类型。

打印(类型(requests.get(url)))

[终端输出]

回应[418]

类’requests.models.Response’requests.get()函数返回响应[418]。

响应状态码418表示您访问的网站存在反爬虫机制,解决方案是使用请求头(suser-agent)进行访问。

3.3.3 访问知乎首页#导入访问网页所用的库

导入请求

#声明一个变量来存储URL

#URL 是一个字符串变量。 URL 前后需要加引号。

url=’https://www.zhihu.com/’

使用#requests.get(website) 访问网页

#库名称(访问的URL)

打印(请求.get(url))

#type() 函数检查requests.get() 函数返回的结果的类型。

打印(类型(requests.get(url)))

[终端输出]

回应[403]

类“requests.models.Response”requests.get()函数返回响应[403]。

响应状态码403 表示服务器拒绝了该请求。

3.4 概述爬虫的第一步通常是请求网页。所请求的网页必须返回200,然后才能继续进行进一步操作。

如果request.get()函数返回的响应状态码不是03 响应状态码

200通常要求您找出请求失败的原因,修复它,然后继续进行后续操作。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
游戏资讯

043 from 库名 import 类,函数,方法

2024-5-11 2:19:41

游戏资讯

#Doinb老婆疑似被带走#冲上热搜第一,爆料Doinb让老婆先探路

2024-5-11 2:32:05

个人中心
购物车
优惠劵
有新私信 私信列表
搜索