看起来Nokogiri不知道如何处理命名空间参数。下面是得到同样结果的另一种方法:这将返回所有div
节点与dd:meta2
参数
require 'nokogiri'
doc = Nokogiri::HTML(<<EOT)
<body>
<div class="myclass" dd:meta1="meta data 1" dd:meta2="CD5503253E54"></div>
<div class="myclass" dd:meta1="meta data 11"></div>
</body>
EOT
doc.search('div').select{ |div| div.attributes.include?('dd:meta2') }
# => [#(Element:0x3fea99895530 {
# name = "div",
# attributes = [
# #(Attr:0x3fea99895508 { name = "class", value = "myclass" }),
# #(Attr:0x3fea998954f4 { name = "dd:meta1", value = "meta data 1" }),
# #(Attr:0x3fea998954e0 { name = "dd:meta2", value = "CD5503253E54" })]
# })]
。
同样,你可以使用相同的用.first
上涨了年底要像at
,但它不会是一样快:
doc.search('div').find{ |div| div.attributes.include?('dd:meta2') }
# => #(Element:0x3fea99895530 {
# name = "div",
# attributes = [
# #(Attr:0x3fea99895508 { name = "class", value = "myclass" }),
# #(Attr:0x3fea998954f4 { name = "dd:meta1", value = "meta data 1" }),
# #(Attr:0x3fea998954e0 { name = "dd:meta2", value = "CD5503253E54" })]
# })
这将是比你如何试图它慢一点因为它会导致解析器搜索整个文档并返回所有div
标签,那么Ruby将不得不筛选结果以找到具有所需参数的节点。但它会比引发异常的代码快得多。
我建议向Nokogiri团队提交一份错误报告,向他们展示问题。
嘿,写一个我做了搜索dd:meta2
跑进your question on Nokogiri-Talk具有到引入nokogiri神解释发生了什么答案,并具有我建议同样的解决方案之后。所以你有它。