2013-02-14 51 views
1

我需要将网页顶部菜单和网页内容区域提取到XML文档中,有没有任何工具可以为我做到这一点? 这应该是网站的顶级菜单结构,即它的站点地图和页面主要内容区域内的每个页面的内容。从网页中自动提取内容和结构

另外,如果你不能建议现有的工具,你能建议如何解决这个问题?

回答