2011-11-01 99 views
0

我想解析网络上存在的HTML文件,该文件在两个选项卡中有一些信息,如Tab XTab Y。加载页面时,默认情况下HTML源代码显示Tab X的内容。点击它可以访问Tab Y中的内容。我如何使用程序获取Tab Y的内容,假设我正在下载带有wget的html文件? Tab Y的内容加载了一些javascript代码__do_postBack()类型的函数。在html代码中获取javascript按钮背后的信息

P.S:我是新来的。请让我知道,以防万一需要更多信息。

+0

只是为了澄清每个人。你想从网站下载一些信息。这个网站使用的标签(也许是Ajax)的内容? – OptimusCrime

+0

我不认为内容是'Ajax'(我不确定)。我提到的__do_postBack()函数是在html元素中调用的,如下所示:'href = javascript:__ do_postBack('lnk_gainers')...' – Sriram

回答

1

__do_postBack()函数很可能是一个ASP.NET回发函数。它将新的POST请求发送到服务器。所以你需要发送带有相同值的wget的新POST请求,因为它们是html表单字段。

+0

感谢您的回复! '__do_postback()'函数很可能是'javascript'代码。它是这样调用的:'href = javascript:__ do_postBack('lnk_gainers')...'。我尝试通过设置post-data'lnk_gainers'来调用带有POST选项的'wget',但这没有帮助。你可以给我一个如何使用'POST'选项来使用'wget'的例子吗? – Sriram

+0

安装Firefox,安装Firebug,打开Firebug面板并观看控制台窗口。链接被点击时是否有任何请求发送? Javascript可以使用Ajax或ASP.NET来加载外部信息。所以如果你下载这个文件,你不会获得你正在查找的信息,因为它尚未加载。 – OptimusCrime

+0

我安装了Firebug,但是当我点击选项卡时,控制台窗口什么也没有显示。我需要更改哪些设置?另外,为什么不让你的评论成为答案?让讨论与答案保持一致会更容易。 – Sriram