我还没有找到任何文档或教程。有这样的事吗?如何在Nokogiri中使用XPath?
doc.xpath('//table/tbody[@id="threadbits_forum_251"]/tr')
上面的代码会得到我的任何table
,任何地方,有一个tbody
孩子与属性id
等于“threadbits_forum_251”。但为什么它以双重//
开头?为什么最后有/tr
?有关更多详细信息,请参阅“Ruby Nokogiri Parsing HTML table II”。
谁能告诉我怎么href
,id
,alt
,src
等,采用引入nokogiri提取?
td[3]/div[1]/a/text()' <--- extracts text
我该如何提取其他东西?
@Rubens谢谢你。你是对的我需要阅读XPath Tutorial.I认为这是我需要阅读的nokorigi文档...你知道是否有任何工具可以给我完整的Xpath,如果我点击并在HTML页面上的对象? – Radek 2010-01-17 11:50:58
我不知道,但XPath并不那么辛苦;考虑你的文件系统,并假设每个文件夹都是一个XML元素;所以,当你选择你的'system32'文件夹时,你会得到'\ windows \ system32'路径;只需用'/'替换'\\'',考虑以'@'开头的属性和'']'的条件,你很好去 – 2010-01-17 12:01:48
我知道这是一个较老的答案,但是xpath教程的链接是现在打破了。我认为现在应该是http://www.w3schools.com/xsl/xpath_intro.asp – Axiombadger 2016-02-17 13:06:41