2013-05-10 55 views
0

我正在尝试使用yahoo管道工具从我的网站页面构建RSS源。xpath在雅虎管道中提取所有不同的id

我能够通过使用从雅虎管道“xphat抓取页面的”从网页中提取只有一个ID:

//*[@id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_0" 

其他人ID是不同的:..lstBlogView_lnkEntry_1..lstBlogView_lnkEntry_2等。

这是HTML文件的一部分:

< div class="vbEntry" > 
<h2> 
< a id="ctr3262_MainView_ViewBlog_lstBlogView_lnkEntry_1" rel="bookmark" href="http://www.site.com/blogs/EntryId/12">word1-word2-word3 </a> 
</h2> 
< div class="vbHeader dnnClear" > 
from < a href='http:/www.site.com/ipse dixit' > ipse dixit </a> , 
< span id="ctr3262_MainView_ViewBlog_lstBlogView_lblPublishDate_1" >sunday 7 december 2012 17:31 </span> 
< div class="dnnRight" ></div> 
</div> 

我如何可以查看所有的ID从我的网页?

+0

请修复您的输入,HTML被搞砸了。 – 2013-05-10 14:41:50

回答

1

如果你正在寻找一个ID的所有元素,其中id包含一个文本使用此

"//*[contains(@id, 'lstBlogView_lnkEntry_') ]" 

与ID的所有元素:

"//*[@id ]" 

所有标识:
从@Jens Erat采取答案

+0

谢谢。我已经使用了你的第一个代码,它能正常工作。 – 2013-05-10 20:11:13

0

您可以通过使用属性一步解决的属性,这个XPath表达式将查询文档中的所有id属性:

//@id