使用Nokogiri获取属性的值使用Nokogiri

我使用Nokogiri解析document.xml文件，该文件是从.docx文件提取的，需要获取名称属性值，如“w:val”。使用Nokogiri获取属性的值使用Nokogiri

这是源XML的示例：

<w:document> 
    <w:body> 
    <w:p w:rsidR="004D5F21" w:rsidRPr="00820E0B" w:rsidRDefault="00301D39" pcut:cut="true"> 
     <w:pPr> 
     <w:jc w:val="center"/> 
     </w:pPr> 
    </w:body> 
</w:document>

这是代码的示例：

require 'nokogiri' 

doc = Nokogiri::XML(File.open(path)) 
    doc.search('//w:jc').each do |n| 
    puts n['//w:val'] 
    end

没有什么在控制台，只有空行。我如何获得属性的值？

来源

2011-12-16 Hroft

require 'nokogiri' 

doc = Nokogiri::XML(File.open(path)) 
    doc.xpath('//jc').each do |n| 
    puts n.attr('val') 
    end

应该工作。不要忘了看看文档：http://nokogiri.org/tutorials/searching_a_xml_html_document.html#fn:1

来源

2011-12-16 14:42:50

嗯，不适合我。 – avy 2011-12-16 14:50:35

现在应该可以工作。 – 2011-12-16 15:15:51

展会有：

require 'nokogiri' 

doc = Nokogiri::XML(File.open(path)) 
    doc.search('jc').each do |n| 
    puts n['val'] 
end

而且，是的，这样说的：http://nokogiri.org/tutorials/searching_a_xml_html_document.html#fn:1

来源

2011-12-16 14:54:12 avy

文件丢失它的命名空间声明，并引入nokogiri不对此感到满意。如果您检查errors方法为您doc，你会看到类似这样的：

 
puts doc.errors 
Namespace prefix w on document is not defined 
Namespace prefix w on body is not defined 
Namespace prefix w for rsidR on p is not defined 
Namespace prefix w for rsidRPr on p is not defined 
Namespace prefix w for rsidRDefault on p is not defined 
Namespace prefix pcut for cut on p is not defined 
Namespace prefix w on p is not defined 
Namespace prefix w on pPr is not defined 
Namespace prefix w for val on jc is not defined 
Namespace prefix w on jc is not defined 
Opening and ending tag mismatch: p line 3 and body 
Opening and ending tag mismatch: body line 2 and document 
Premature end of data in tag document line 1

利用引入nokogiri的CSS存取，而不是XPath的，你可以围绕命名空间的问题步骤：

puts doc.at('jc')['val']

将输出：

center

如果您需要遍历多个jc节点上，使用search或其aliase之一类似于你之前的做法。

来源

2011-12-16 15:30:57

使用Nokogiri获取属性的值使用Nokogiri

回答

相关问题