Python抓站在我们解决某些搜索引擎中的问题时有很广泛的应用。但是有些代码我们还是不能熟练的掌握。下面我们就详细的看看如何进行相关的问题解决。希望大家对Python抓站有所收获。
import urllib2
- content = urllib2.urlopen('http://XXXX').read()
使用代理服务器
这在某些情况下比较有用,比如IP被封了,或者比如IP访问的次数受到限制等等。
- import urllib2
- proxy_support = urllib2.ProxyHandler({'http':'http://XX.XX.
XX.XX:XXXX'})- opener = urllib2.build_opener(proxy_support, urllib2.
HTTPHandler)- urllib2.install_opener(opener)
- content = urllib2.urlopen('http://XXXX').read()
以上就是对Python抓站有关问题的详细介绍。
【编辑推荐】