发布时间:2018-09-06 20:19:15编辑:Run阅读(7553)
urllib的error模块定义了由 request模块产生的异常。如果出现了问题,request 模块便会抛出error模块中定义的异常。
1 URLError
URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由 request模块生的异常都可以通过捕获这个类来处理
它具有一个属性reason,即返回错误的原因。
实例:
from urllib import request, error try: response = request.urlopen('https://py3study111.com') except error.URLError as e: print(e.reason)
打开一个不存在的域名,按理来说应该会报错,但是捕获了URLError异常后,运行结果为:
程序没有直接报错,而是输出了上面的内容,通过异常的捕获,可以避免程序的异常终止,还可以直观地看见错误信息,方面处理
2 HTTPError
它是URLError的子类,专门用来处理HTTP请求错误,比如认证请求失败等,有三个属性。
code:返回HTTP状态码,比如404表示网页不存在,500表示服务器内部错误等。
reason:同父类一样,用于返回错误的原因。
headers:返回请求头。
实例:
from urllib import request, error try: response = request.urlopen('http://www.dagouzi.cn/111.html') except error.HTTPError as e: print(e.reason, e.code, e.headers, sep='\n')
运行结果:
注释:访问一个网站不存在的页面,捕获了HTTPError异常,输出了reason,code和headers属性
因为URLError是HTTPError的父类,所以可以先选择捕获子类的错误,再去捕获父类的错误,更好的写法如下:
from urllib import request, error try: response = request.urlopen('http://www.dagouzi.cn/111.html') except error.HTTPError as e: print(e.reason, e.code, e.headers, sep='\n') except error.URLError as e: print(e.reason) else: print('Request Successfully')
注释:这样可以做到先捕获HTTPError,获取它的错误状态码,错误信息,headers信息。如果不是HTTPError异常,就会捕获URLError异常,输出错误原因。最后,用else来处理逻辑。
有时候,reason属性返回的不一定是字符串,也可能是一个对象
实例:
import socket import urllib.request import urllib.error try: response = urllib.request.urlopen('https://www.baidu.com', timeout=0.01) except urllib.error.URLError as e: if isinstance(e.reason, socket.timeout): print('Time out')
运行结果:
Time out
注释:直接设置超时时间来强制抛出timeout异常,reason属性的结果是socket.timeout类,这里使用isinstance()方法来判断它的类型,做出更详细的异常判断。
上一篇: urllib高级用法--登陆和cookies的使用
下一篇: 没有了
47604
45983
36909
34467
29079
25713
24565
19714
19245
17756
5564°
6155°
5690°
5737°
6703°
5482°
5484°
5988°
5965°
7295°