2

我想用代理将java中的页面源代码拉出来。较高的网页源代码提供者

我已经使用httpclient,httpunit和HttpURLConnection,所有这一切都需要5秒,当我去寻找没有代理的页面源代码,但我使用代理,然后它采取12-15秒的单页。

有什么办法提高速度或提供快速页面源的其他类。

+0

如果它的工作速度够快而没有代理,为什么你需要一个? – AbdullahC 2011-04-21 10:38:46

回答

1

您需要确定问题的首先位置:您从中拉出网页的服务器真的很慢,还是您使用的代理服务器真的很慢(或两者都有)? 如果您在命令行中使用wget(或者甚至可能是curl)类似的东西,它应该向您显示有关页面下载时间的统计信息 - 通过代理和绕过代理。如果这些时间与您的代码显示的时间相同,那么您无法优化。但是,如果您看到差异,则可以使用其他方式在代码中拉出页面。 作为一个一般的经验法则:

如果你正在处理大量的连接
  • 使用普通的Java IO,如果你正在处理大量转移到只有主机/服务器
  • 屈指可数的
    • 采用Java NIO