2010-07-07 148 views
0

我有一个java字符串处理SGML,这样的事情...解析java字符串处理的SGML

<misspell></misspell><plain>I</plain> <plain>know</plain> <plain>you</plain> <suggestion>ducky</suggestion> <plain>suck</plain> <plain>and</plain> <plain>I</plain> <plain>rocky</plain> <plain>rock</plain> 

如何解析它来获得例如说里面<suggestion> </suggestion>文本,以便得到“鸭子”出?

javax.swing.text.html.parser.Parse会有帮助吗?或者我只能用它解析HTML文档?

回答

1

您显示的字符串不是HTML,但可以由an XML parser解析。

SAX API是JDK和AFAIK大部分XML解析器实现它的一部分。

+1

它只是一个纯String.Will的SAX API(javax.xml.parsers)的工作? – 2010-07-07 10:37:16

+1

@Myth,来自[Javadoc](http://java.sun.com/j2se/1.4.2/docs/api/javax/xml/parsers/SAXParser.html):“XML可以从各种输入源,这些输入源是InputStreams,Files,URLs和SAX InputSources“。而且似乎可以使用StringReader构造一个InputSource。 – 2010-07-07 12:05:36