0
我认为使用lxml的图书馆在Python可以帮助,但不能找出如何做到这一点?如何运行的蟒蛇在html页面的XPath?
我认为使用lxml的图书馆在Python可以帮助,但不能找出如何做到这一点?如何运行的蟒蛇在html页面的XPath?
一个简单的起点......
import lxml.html
page = lxml.html.parse('http://www.google.com').getroot()
print page.xpath('//a/@href')
感谢的人。我真的很感激帮助... – grv 2012-07-16 11:01:15
它是一个XHTML页面?因为不是所有的HTML是有效的XML – Steve 2012-07-14 09:33:58