如果你在Python抓取中遇到问题,查了很多地方不知道怎么解决,你可以通过以下的文章对 Python抓取有一个详细的了解,通过对它的了解你可以在股票信息等其他信息中获取自己想要查询的东西。
需要在python上加点东西,做起来就简单了。 jquery在做html内容提取,分析的时候很方便。而python做类似的工作就麻烦一点,原来我都是用正则表达式或者HtmlParser的 。两者用着都不是太爽,今天发现了一个好东西 pyquery ,一个类似jquery的python库。
摘抄一段使用说明 :
- from pyquery import PyQuery as pq
- from lxml import etree
- d = pq(" <html> < span>html>")
- d = pq(etree.fromstring(" <html> < span>html>"))
- d = pq(url='http://google.com/')
- d = pq(filename=path_to_html_file)
- Now d is like the $ in jquery:
- d("#hello")
- [ <p#hello.hello>]
- p = d("#hello")
- p.html()
- 'Hello world !'
- p.html("you know <a href='http://
- python.org/'>Python < span>a> rocks")
- [ <p#hello.hello>]
- p.html()
- 'you know <a href="http://python.org/">
- Python < span>a> rocks'
- p.text()
- 'you know Python rocks'
简单吧,安装也很简单解压缩 python setup.py install 就可以了,可能要安装ezsetup现在的版本是0.3,还有一些jquery的东西没有实现,比如:radio,:password,以及一些ajax的功能,通过以的介绍你就可以更好的了解Python抓取的应用了,赶紧试试吧。
【编辑推荐】