我有一个蜘蛛类,在用户请求蜘蛛网站的内容。每个搜索结果都会加载大约30个网站,搜索这些信息并将其标准化。Java:HtmlUnit效率关系PHP CURL?
我已经使用CURL在PHP中编写了它,因为PHP缺少多任务我想切换到Java(我知道多进程卷曲不适合我的需求)。我需要一个可以POST/GET的HTTP客户端,接收和设置cookie以及修改HTTP头。
我发现HtmlUnit看起来很漂亮,但也超出了我的需求,而且由于软件包相对较大,一分钟我会有很多的寻线请求,我不想过度使用解决方案来减慢我的服务器速度。
你认为这会是一个问题,你有其他建议来取代Java中的CURL吗?我应该使用Java CURL绑定吗? 这是一个问题效率和服务器负载。
我已经测试的效率: 4)的Java/6,2的HtmlUnit秒 3)的Java/Apache_HTTPClient 5,3秒 2)PHP/CURL 4,92 Secods 1)的Java/Jsoup 1,8秒 – 2011-06-04 21:39:31