2012-04-04 60 views
-1

我有一个包含一些java脚本标签的HTML文件。当我在某些浏览器(如IE)中运行此文件时,某些内容会从源代码缓存并显示在浏览器上(例如,某些城市的天气)。我怎样才能运行这个html文件并获取之前在Web浏览器上显示的网页内容?我不想在我的应用程序中显示内容;我想解析返回的数据并提取一些特殊的内容(例如提取每个城市的天气)。 任何人都可以引导我吗?java:获取html内容

+0

这个问题是太不具体,当它seeems,无关与Java。我削减了'java'标记 – HerrSerker 2012-04-04 07:25:00

+0

我想要一个Java应用程序在服务器中使用它。我得到输入并返回从站点获得的数据。我需要一个java库来解析从web服务器接收到的html文件或内容,并提取我最喜欢的标签。所以我的问题是关于java! – sajad 2012-04-04 07:35:55

回答

1

你想要做的就是调用html scraping。

你最好的选择是以图书馆的形式获得帮助,因为这是一个复杂而复杂的任务。

看到这个问题:Options for HTML scraping?