2010-12-09 75 views
48

选择XML节点时,如何忽略命名空间我要解析,看起来像这样的XML文档:使用XPath

<?xml version="1.0" encoding="UTF-8" ?> 
<m:OASISReport xmlns:m="http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd" 
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
       xsi:schemaLocation="http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd"> 
    <m:MessagePayload> 
    <m:RTO> 
    <m:name>CAISO</m:name> 
    <m:REPORT_ITEM> 
    <m:REPORT_HEADER> 
     <m:SYSTEM>OASIS</m:SYSTEM> 
     <m:TZ>PPT</m:TZ> 
     <m:REPORT>AS_RESULTS</m:REPORT> 
     <m:MKT_TYPE>HASP</m:MKT_TYPE> 
     <m:UOM>MW</m:UOM> 
     <m:INTERVAL>ENDING</m:INTERVAL> 
     <m:SEC_PER_INTERVAL>3600</m:SEC_PER_INTERVAL> 
    </m:REPORT_HEADER> 
    <m:REPORT_DATA> 
     <m:DATA_ITEM>NS_PROC_MW</m:DATA_ITEM> 
     <m:RESOURCE_NAME>AS_SP26_EXP</m:RESOURCE_NAME> 
     <m:OPR_DATE>2010-11-17</m:OPR_DATE> 
     <m:INTERVAL_NUM>1</m:INTERVAL_NUM> 
     <m:VALUE>0</m:VALUE> 
    </m:REPORT_DATA> 

的问题是,在命名空间“http://oasissta.caiso.com/mrtu -oasis/xsd/OASISReport.xsd“有时可能会有所不同。我想完全忽略它,只需从标记MessagePayload下游获取我的数据。

我使用至今的代码是:

String[] namespaces = new String[1]; 
    String[] namespaceAliases = new String[1]; 

    namespaceAliases[0] = "ns0"; 
    namespaces[0] = "http://oasissta.caiso.com/mrtu-oasis/xsd/OASISReport.xsd"; 

    File inputFile = new File(inputFileName); 

    Map namespaceURIs = new HashMap(); 

    // This query will return all of the ASR records. 
    String xPathExpression = "/ns0:OASISReport 
          /ns0:MessagePayload 
           /ns0:RTO 
           /ns0:REPORT_ITEM 
           /ns0:REPORT_DATA"; 
    xPathExpression += "|/ns0:OASISReport 
         /ns0:MessagePayload 
         /ns0:RTO 
          /ns0:REPORT_ITEM 
          /ns0:REPORT_HEADER"; 

    // Load up the raw XML file. The parameters ignore whitespace and other 
    // nonsense, 
    // reduces DOM tree size. 
    SAXReader reader = new SAXReader(); 
    reader.setStripWhitespaceText(true); 
    reader.setMergeAdjacentText(true); 
    Document inputDocument = reader.read(inputFile); 

    // Relate the aliases with the namespaces 
    if (namespaceAliases != null && namespaces != null) 
    { 
    for (int i = 0; i < namespaceAliases.length; i++) 
    { 
    namespaceURIs.put(namespaceAliases[i], namespaces[i]); 
    } 
    } 

    // Cache the expression using the supplied namespaces. 
    XPath xPath = DocumentHelper.createXPath(xPathExpression); 
    xPath.setNamespaceURIs(namespaceURIs); 

    List asResultsNodes = xPath.selectNodes(inputDocument.getRootElement()); 

它工作正常,如果命名空间永远不会改变,但是这显然不是这样的。我需要做些什么来使其忽略命名空间?或者,如果我知道所有可能的名称空间值的集合,我如何将它们全部传递给XPath实例?

+2

@ user452103:XPath是XML名称抱怨,所以它永远不会忽略的命名空间。您可以使用**表达式**来选择关于名称空间的节点。如果名称空间URI经常发生更改,那么是错误的URI。 **命名空间URI假设表示该元素属于特定的XML词汇表**。 – 2010-12-09 19:49:02

+0

@ user452103:保持这种格式,更清晰。 – 2010-12-09 19:54:13

回答

35

使用

/*/*/*/*/* 
     [local-name()='REPORT_DATA' 
     or 
     local-name()='REPORT_HEADER' 
     ] 
104

这是常见问题(但我懒得去搜索重复今天)

在XPath 1.0

//*[local-name()='name'] 

选择所有的元素与 “名” 为本地名

在XPath 2.0你可以使用:

//*:name