2013-02-13 74 views
0

我有以下XML,并且想要使用Java和可能的XPath在en-note元素下包括文本和子元素提取下的所有内容如何从Java中提取XML元素和文本

源XML:

<en-note style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;"> 
    A little test note… 
    <div><br/></div> 
    <div> 
    <ul> 
     <li>blah</li> 
    </ul> 
    </div> 
</en-note> 

我想提取什么:

A little test note… 
    <div><br/></div> 
    <div> 
    <ul> 
     <li>blah</li> 
    </ul> 
    </div> 

感谢,

+0

http://docs.oracle.com/javase/tutorial/jaxp/xslt/xpath.html? – condit 2013-02-14 00:01:13

+0

问题在于我无法找到抓取子元素和文本的方法。我只能使用XPath获取一个或另一个 – 2013-02-16 21:48:19

回答

0

您需要成为String.indexOf和String.substring(最好的朋友)

我自己可以给你的最好的答案,而不是自己做的是告诉你找到一个点indexOf然后用子串解析它

+0

使用现有的库会更好。如果在XML中出现过另一个元素,并且其内容中包含文本“en-note”会怎么样? – jahroy 2013-02-14 00:04:46

+0

您创建了一个名为temp的第二个字符串。你加载了所有的XML。然后从上到下分析它,直到你得到你想要的。它非常标准的程序。 – 2013-02-14 00:06:05

+0

IndexOf抓住你要求的第一个实例,所以你直线地啃开XML,直到你有你需要的东西 – 2013-02-14 00:07:00