2014-10-18 140 views
3

这是我的xml文件的一个小样本。Xpath local-name()中的属性

<w:p xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main"> 
    <w:pPr> 
     <w:rPr> 
     <w:highlight w:val="yellow"/> 
     </w:rPr> 
    </w:pPr> 
    <w:bookmarkStart w:id="0" w:name="_GoBack"/> 
    <w:bookmarkEnd w:id="0"/> 
    <w:r w:rsidRPr="00D1434D"> 
     <w:rPr> 
     <w:rFonts w:ascii="Times New Roman" 
        w:eastAsia="MS PGothic" 
        w:hAnsi="Times New Roman"/> 
     <w:b/> 
     <w:color w:val="000000"/> 
     <w:sz w:val="24"/> 
     <w:szCs w:val="24"/> 
     <w:highlight w:val="yellow"/> 
     </w:rPr> 
     <w:t xml:space="preserve">Responses to </w:t> 
    </w:r> 
    <w:r w:rsidR="00335D4A" w:rsidRPr="00D1434D"> 
     <w:rPr> 
     <w:rFonts w:ascii="Times New Roman" 
        w:eastAsia="MS PGothic" 
        w:hAnsi="Times New Roman"/> 
     <w:b/> 
     <w:color w:val="000000"/> 
     <w:sz w:val="24"/> 
     <w:szCs w:val="24"/> 
     <w:highlight w:val="yellow"/> 
     <w:lang w:eastAsia="ja-JP"/> 
     </w:rPr> 
     <w:t>the Reviewer</w:t> 
    </w:r> 
</w:p> 

我想提取与w:highlight标签特别具有属性value = “黄色”文本。我搜索了它,但无法提出解决方案。在一般的亮点

以下工作:

for t in source.xpath('.//*[local-name()="highlight"]/../..//*[local-name()="t"]'): 
    do something 

我想:

for t in lxml_tree.xpath('//*[local-name()="highlight"][@val="yellow"]/../..//*[local-name()="t"]'): 

这是不行的,没有返回..

+0

对于未来的问题,确保你的XML是_properly formatted_和可读性(一个令人难以置信的长线不是)。另外,'w:'前缀没有被声明,你的XML代码片段格式不正确,因为缺少''。 – 2014-10-18 10:00:45

+0

如何在SO上格式化xml数据? – 2014-10-18 10:01:46

+0

这个[问题](http://stackoverflow.com/questions/2243131/getting-certain-attribute-value-using-xpath)有点类似,但它在local-name()上不起作用。 – 2014-10-18 10:03:44

回答

8

w:val属性是命名空间,因此你不能只通过@val来解决它。一个可能的解决方案是通过使用@*[local-name()='attribute name']表达它的本地名称,类似于你为元素是如何处理的属性:

//*[local-name()="highlight"][@*[local-name()='val' and .='yellow']]/../..//*[local-name()="t"] 
+0

如何使用'following ::'而不是'/../..//'?请参阅http://xsltransform.net/bdxtpQ。 – 2014-10-18 10:12:19

+0

你能解释你的答案吗?我不明白@ *是什么,“和。=” – 2014-10-18 10:12:31

+1

@Swordy'@ *'表示任何属性,类似于“// *”,表示任何元素。 '。'指的是当前的上下文,在这个特定的用法中,它是'@ *' – har07 2014-10-18 10:16:15