2011-04-29 234 views
0

我需要获取给定的网页,然后将HTML标记转换为XML标记,并从这些XML标记中创建一棵树。我怎样才能做到这一点 ??请告诉我一些很好的链接或基于这些教程,顺便说一句,我使用的是Java语言。通过java获取网页

谢谢。

+0

您是否尝试过但都写任何代码? HTML通常包含无效的分层XML内容。这不是一件容易的事。 – 2011-04-29 18:54:11

回答

1

HttpClient获取数据。 HtmlCleaner把它变成XML。

都有教程。

+0

+1为快速触发手指 – Kal 2011-04-29 18:56:07