2009-12-14 63 views
0

假设是网页使用正确的标签进行编码。我如何将它转换为XML文件?我认为大多数网页可以被视为dom树...我如何将它转换为XML文件?如何将网页转换为使用java的xml文档?

+0

HTML不是HTML的子集吗?我想你需要给我们更多关于你想要做什么的信息。 – morgancodes 2009-12-14 10:15:59

+0

html页面可以被视为dom。否则html页面可以转换为dom。我想从dom转换到xml。 – professionalcoder2010 2009-12-14 10:17:33

回答

0

JTidy读取HTML并将其呈现为DOM。一旦你将HTML作为一个DOM,你应该能够处理它并把它写成XML。

要输出DOM,请参阅example code here以及特别的XMLSerializer。

+0

感谢您的链接。如何将其转换为xml文件? – professionalcoder2010 2009-12-14 10:23:16