2011-09-15 248 views
3

如何获得标签后的文本中找到如何获得标签后的文本

例子:

#!/usr/bin/env python 
import lxml.html 

html = """ 
<b>Point1:</b> Text1 <br> 
<b>Point2:</b> Text2 <br> 
... 
<b>PointN:</b> TextN 
<b>PointN+1:</b> TextN+1<br> 
""" 
dom = lxml.html.document_fromstring(html) 
el = dom.xpath('//b[text()="PointN:"]') 
print el 

标签EL与文本焦点N发现了如何获取文本TextN?

回答

3

由于TextN如下,你已经找到了<b>,您可以使用XPath following轴:

dom.xpath('//b[text() = "PointN:"]/following::node()')[0] 
3

另一种方法是:

el = dom.xpath('//b[text()="PointN:"]')[0] 
print el.tail