urllib异常处理

发布时间:2018-09-06 20:19:15编辑:Run阅读(7553)

    urllib的error模块定义了由 request模块产生的异常。如果出现了问题,request 模块便会抛出error模块中定义的异常。

    1 URLError

    URLError类来自urllib库的error模块,它继承自OSError类,是error异常模块的基类,由 request模块生的异常都可以通过捕获这个类来处理

    它具有一个属性reason,即返回错误的原因。

    实例:

    from urllib import request, error
    try:
        response = request.urlopen('https://py3study111.com')
    except error.URLError as e:
        print(e.reason)

    打开一个不存在的域名,按理来说应该会报错,但是捕获了URLError异常后,运行结果为:

    blob.png

    程序没有直接报错,而是输出了上面的内容,通过异常的捕获,可以避免程序的异常终止,还可以直观地看见错误信息,方面处理



    2 HTTPError

    它是URLError的子类,专门用来处理HTTP请求错误,比如认证请求失败等,有三个属性。

    code:返回HTTP状态码,比如404表示网页不存在,500表示服务器内部错误等。

    reason:同父类一样,用于返回错误的原因。

    headers:返回请求头。


    实例:

    from urllib import request, error
    try:
        response = request.urlopen('http://www.dagouzi.cn/111.html')
    except error.HTTPError as e:
        print(e.reason, e.code, e.headers, sep='\n')

    运行结果:

    blob.png

    注释:访问一个网站不存在的页面,捕获了HTTPError异常,输出了reason,code和headers属性



    因为URLError是HTTPError的父类,所以可以先选择捕获子类的错误,再去捕获父类的错误,更好的写法如下:

    from urllib import request, error
    try:
        response = request.urlopen('http://www.dagouzi.cn/111.html')
    except error.HTTPError as e:
        print(e.reason, e.code, e.headers, sep='\n')
    except error.URLError as e:
        print(e.reason)
    else:
        print('Request Successfully')

    注释:这样可以做到先捕获HTTPError,获取它的错误状态码,错误信息,headers信息。如果不是HTTPError异常,就会捕获URLError异常,输出错误原因。最后,用else来处理逻辑。



    有时候,reason属性返回的不一定是字符串,也可能是一个对象

    实例:

    import socket
    import urllib.request
    import urllib.error
    
    try:
        response = urllib.request.urlopen('https://www.baidu.com', timeout=0.01)
    except urllib.error.URLError as e:
        if isinstance(e.reason, socket.timeout):
            print('Time out')

    运行结果:

    Time out


    注释:直接设置超时时间来强制抛出timeout异常,reason属性的结果是socket.timeout类,这里使用isinstance()方法来判断它的类型,做出更详细的异常判断。


关键字

上一篇: urllib高级用法--登陆和cookies的使用

下一篇: 没有了