如何运行的蟒蛇在html页面的XPath？

我认为使用lxml的图书馆在Python可以帮助，但不能找出如何做到这一点？如何运行的蟒蛇在html页面的XPath？

2012-07-14 grv

它是一个XHTML页面？因为不是所有的HTML是有效的XML – Steve 2012-07-14 09:33:58

一个简单的起点......

import lxml.html 
page = lxml.html.parse('http://www.google.com').getroot() 
print page.xpath('//a/@href')

2012-07-14 09:37:08

感谢的人。我真的很感激帮助... – grv 2012-07-16 11:01:15

回答