发布时间:2018-09-06 20:19:15编辑:Run阅读(7651)
urllib的error模块定义了由 request模块产生的异常。如果出现了问题,request 模块便会抛出error模块中定义的异常。
1 URLError
URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由 request模块生的异常都可以通过捕获这个类来处理
它具有一个属性reason,即返回错误的原因。
实例:
from urllib import request, error try: response = request.urlopen('https://py3study111.com') except error.URLError as e: print(e.reason)
打开一个不存在的域名,按理来说应该会报错,但是捕获了URLError异常后,运行结果为:
程序没有直接报错,而是输出了上面的内容,通过异常的捕获,可以避免程序的异常终止,还可以直观地看见错误信息,方面处理
2 HTTPError
它是URLError的子类,专门用来处理HTTP请求错误,比如认证请求失败等,有三个属性。
code:返回HTTP状态码,比如404表示网页不存在,500表示服务器内部错误等。
reason:同父类一样,用于返回错误的原因。
headers:返回请求头。
实例:
from urllib import request, error try: response = request.urlopen('http://www.dagouzi.cn/111.html') except error.HTTPError as e: print(e.reason, e.code, e.headers, sep='\n')
运行结果:
注释:访问一个网站不存在的页面,捕获了HTTPError异常,输出了reason,code和headers属性
因为URLError是HTTPError的父类,所以可以先选择捕获子类的错误,再去捕获父类的错误,更好的写法如下:
from urllib import request, error try: response = request.urlopen('http://www.dagouzi.cn/111.html') except error.HTTPError as e: print(e.reason, e.code, e.headers, sep='\n') except error.URLError as e: print(e.reason) else: print('Request Successfully')
注释:这样可以做到先捕获HTTPError,获取它的错误状态码,错误信息,headers信息。如果不是HTTPError异常,就会捕获URLError异常,输出错误原因。最后,用else来处理逻辑。
有时候,reason属性返回的不一定是字符串,也可能是一个对象
实例:
import socket import urllib.request import urllib.error try: response = urllib.request.urlopen('https://www.baidu.com', timeout=0.01) except urllib.error.URLError as e: if isinstance(e.reason, socket.timeout): print('Time out')
运行结果:
Time out
注释:直接设置超时时间来强制抛出timeout异常,reason属性的结果是socket.timeout类,这里使用isinstance()方法来判断它的类型,做出更详细的异常判断。
上一篇: urllib高级用法--登陆和cookies的使用
下一篇: 没有了
47745
46235
37110
34627
29229
25886
24745
19863
19417
17908
5716°
6315°
5835°
5888°
6984°
5829°
5846°
6361°
6316°
7673°