一、前言
本文主要说URLError 还有 HTTPError,以及一些处理方式。
二、URLError
1. 解释下 URLError 可能产生的3个原因:
- # 1. 网络无连接,即本机无法上网。
- # 2. 连接不到特定的服务器。
- # 3. 服务器不存在。
2. 案例
例:
在代码中,需要用 try-except 语句来包围并捕获相应的异常。
- # coding:UTF8
- import urllib.request
- request = urllib.request.urlopen("http://www.baidu.com")
- try:
- urllib.request.urlopen(request)
- print("[Errno 11004] getaddrinfo failed")
- except urllib.URLError as e:
- print(e.reason)
利用了 urlopen 方法访问了一个不存在的网址。
运行结果:
注:
它说明了错误代号是11004,错误原因是 getaddrinfo failed。
三、HTTPError
HTTPError 是 URLError 的子类,在利用 urlopen 方法发出一个请求时,服务器上都会对应一个应答对象 response,其中它包含一个数字”状态码”。
例:
捕获的异常是 HTTPError,它会带有一个 code 属性,就是错误代号,另外又打印了 reason 属性,这是它的父类 URLError 的属性。
- import urllib2
- req = urllib2.Request('http://blog.csdn.net/cqcre')
- try:
- urllib2.urlopen(req)
- except urllib2.HTTPError, e:
- print e.code
- print e.reason
运行结果:
1. 代码解析
错误代号是 403,错误原因是 Forbidden,说明服务器禁止访问。
知道,HTTPError 的父类是 URLError,根据编程经验,父类的异常应当写到子类异常的后面,如果子类捕获不到,那么可以捕获父类的异常,
2. 优化代码
- import urllib2
- req = urllib2.Request('http://blog.csdn.net/cqcre')
- try:
- urllib2.urlopen(req)
- except urllib2.HTTPError, e:
- print e.code
- except urllib2.URLError, e:
- print e.reason
- else:
- print "OK"
如果捕获到了 HTTPError,则输出 code,不会再处理 URLError 异常。如果发生的不是HTTPError,则会去捕获 URLError 异常,输出错误原因。
另外还可以加入 hasattr 属性提前对属性进行判断,代码改写如下
- import urllib2
- req = urllib2.Request('http://blog.csdn.net/cqcre')
- try:
- urllib2.urlopen(req)
- except urllib2.URLError, e:
- if hasattr(e,"code"):
- print e.code
- if hasattr(e,"reason"):
- print e.reason
- else:
- print "OK"
3. 异常处理方法
首先对异常的属性进行判断,以免出现属性输出报错的现象。
假如 response 是一个”重定向”,需定位到别的地址获取文档,urllib2 将对此进行处理。
注 :
HTTPError 实例产生后会有一个 code 属性,这就是是服务器发送的相关错误号。
因为 urllib2 可以为处理重定向,也就是 3 开头的代号可以被处理,并且 100-299 范围的号码指示成功,所以只能看到 400-599 的错误号码。
四、总结
本文基于基础,通过案例的分析,代码的展示。解决在实际应用中,对于URLError空异常的处理方式。介绍了两种主要的异常错误。以及提供了相应错误的解决方案处理方法。
欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。
使用语言,能够让读者更清晰,更直观的理解文章内容。代码很简单,希望对学习有帮助。