在这里选择文本:如何使用XPath过滤选定文本中的某些单词?
Alpha Bravo Charlie Delta Echo Foxtrot
来自这个HTML结构:
<div id="entry-2" class="item-asset asset hentry">
<div class="asset-header">
<h2 class="asset-name entry-title">
<a rel="bookmark" href="http://blahblah.com/politics-democrat">Pelosi Q&A</a>
</h2>
</div>
<div class="asset-content entry-content">
<div class="asset-body">
<p>Alpha Bravo Charlie Delta Echo Foxtrot</p>
</div>
</div>
</div>
我应用以下XPath表达式来选择asset-body
中的文本:
//div[contains(
div/h2[
contains(concat(' ',@class,' '),' asset-name ')
and
contains(concat(' ',@class,' '),' entry-title ')
]/a[@rel='bookmark']/@href
,'democrat')
]/div/div[
contains(concat(' ',@class,' '),' asset-body ')
]//text()
我将如何消毒文本中的以下单词:
Alpha
Charlie
Echo
因此,在本例中我只得到以下文本:
Bravo Delta
问得好,+1。请参阅我的答案以获取解释和XPath 2.0解决方案。 – 2010-11-01 17:58:11