2010-06-28 140 views
11

我在这里粘贴一些代码,在没有警告的情况下使用gcc file.c -lxml2编译,假定libxml2安装在您的系统中。命名空间和xpath的libxml2错误

#include <libxml/parser.h> 
#include <libxml/xpath.h> 
#include <assert.h> 
#include <libxml/tree.h> 
#include <libxml/xpathInternals.h> 

xmlDocPtr 
getdoc (char *docname) { 
    xmlDocPtr doc; 
    doc = xmlParseFile(docname); 

    if (doc == NULL) { 
     fprintf(stderr,"Document not parsed successfully. \n"); 
     return NULL; 
    } 

    return doc; 
} 

xmlXPathObjectPtr 
getnodeset (xmlDocPtr doc, xmlChar *xpath){ 

    xmlXPathContextPtr context; 
    xmlXPathObjectPtr result; 

    context = xmlXPathNewContext(doc); 
    if (context == NULL) { 
     printf("Error in xmlXPathNewContext\n"); 
     return NULL; 
    } 

    if(xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new") != 0) { 
     fprintf(stderr,"Error: unable to register NS with prefix"); 
     return NULL; 
    } 

    result = xmlXPathEvalExpression(xpath, context); 
    xmlXPathFreeContext(context); 
    if (result == NULL) { 
     printf("Error in xmlXPathEvalExpression\n"); 
     return NULL; 
    } 
    if(xmlXPathNodeSetIsEmpty(result->nodesetval)){ 
     xmlXPathFreeObject(result); 
       printf("No result\n"); 
     return NULL; 
    } 
    return result; 
} 

int 
main(int argc, char **argv) { 

    char *docname; 
    xmlDocPtr doc; 
    xmlChar *xpath = (xmlChar*) "/new:book/section1"; 
    xmlNodeSetPtr nodeset; 
    xmlXPathObjectPtr result; 
    int i; 
    xmlChar *keyword; 

    if (argc <= 1) { 
     printf("Usage: %s docname\n", argv[0]); 
     return(0); 
    } 

    docname = argv[1]; 
    doc = getdoc(docname); 
    result = getnodeset (doc, xpath); 
    if (result) { 
     nodeset = result->nodesetval; 
     for (i=0; i < nodeset->nodeNr; i++) { 
      keyword = xmlNodeListGetString(doc, nodeset->nodeTab[i]->xmlChildrenNode, 1); 
     printf("keyword: %s\n", keyword); 
     xmlFree(keyword); 
     } 
     xmlXPathFreeObject (result); 
    } 

    xmlFreeDoc(doc); 
    xmlCleanupParser(); 
    return (1); 
} 

我的问题是,我想分析下面的XML

<?xml version="1.0" encoding="UTF-8"?> 
<book xmlns="http://www.example.com/new"> 
    <section1>Sec_1</section1> 
    <section2>Sec_2</section2> 
</book> 

书元素定义元素内的命名空间。我想打印xpath/book/section1中的值,并返回NULL。当我试图返回名称空间下的元素时,我也会收到错误,例如/ new:book/section1

我假设我的代码失败,因为我没有正确使用名称空间前缀。我没有时间。能否请你帮忙?

回答

2

这是默认命名空间的问题。要匹配您需要的路径/ new:tag/new:标签 等等

3

这是libXml库令人讨厌的故障。正如cateof指出,问题是默认的命名空间声明:

的xmlns = “http://www.example.com/new”

两个选择:
(1)摆脱声明中您的书签 或 (2)给它一个名称,并在您的标签中使用该名称。

例如

的xmlns:新= “http://www.example.com/new”

那么你的标签看起来都像:

新:书 新:SECTION1

等。

+2

是否可以告诉'libxml',有些命名空间是默认/隐含的文档中的所有元素,以避免过度重复它,在XPath查询结束? – SasQ 2013-08-21 19:12:29

28

原来,当我从here, 发现它不是真正的libxml的失败,这是一个问题,因为libxml的正确遵循XML/XPATH规范。

但是,如果您控制了正在解析的xml文档,R Bourdeau提出的解决方案是正确的。

XPATH查询的上下文是独立的 xml文档中的命名空间限定符。默认名称空间强制所有子标签进入一个名称空间;他们不需要文档中的合格,但必须在xpath查询中被限定。幸运的是,您使用libXml将名称空间注册为new,因此cateof的解决方案应该可以工作。

xmlXPathRegisterNs(context, BAD_CAST "new", BAD_CAST "http://www.example.com/new" 

xmlChar *xpath = (xmlChar*) "/new:book/new:section1"; 

我在这里内联XML能见度:

<?xml version="1.0" encoding="UTF-8"?> 
<book xmlns="http://www.example.com/new"> 
    <section1>Sec_1</section1> 
    <section2>Sec_2</section2> 
</book> 
+2

这是第一个与XPath和命名空间相关的答案,它实际上解释了发生了什么以及如何解决它。我衷心感谢你我的朋友。 – 2013-02-14 11:08:54