2009-08-17 40 views
0

我正在阅读大型文档,而我只需要5%以上的大文档,我可以使用HttpClient 4执行以下操作吗?在HttpClient 4中读取和终止流0

  1. 请求的页面(GET或POST)
  2. 读响应为流
  3. 将其送到基于SAX-HTML解析器“对飞”
  4. 当检测到某些HTML标签 - 终止流

请注意,HttpClient的4节所需要的 - 我不能使用v 3

回答

0

感谢肯从HttpClient的邮件列表这里的。答案

使用HttpEntity#的getContent() 方法,该方法返回一个
的java.io.InputStream,并传递到您的 基于SAX的HTML解析器。

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e122

当你看到你所需要的标签, 通过调用 HttpUriRequest#中止()方法终止该请求。

http://hc.apache.org/httpcomponents-client/tutorial/html/fundamentals.html#d4e285