2011-03-17 49 views
0

我在尝试下载HTML,因此我可以使用最小带宽进行解析并下载。这是我的一些代码。从WebResponse下载响应 - 包括图像?

if (!String.IsNullOrEmpty(siteAddress)) 
       webReq = WebRequest.Create(siteAddress) 

       WebResponse webRes = webReq.GetResponse(); 

       Stream streamResponse = webRes.GetResponseStream(); 
       StreamReader streamRead = new StreamReader(streamResponse); 
       StringReader sr = new StringReader(streamRead.ReadToEnd().Trim()); 

       streamResponse.Close(); 
       streamRead.Close();  
       webRes.Close(); 

       HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument(); 
       hDoc.Load(sr); 

有人可以确认检索响应只提供文本响应,并且也没有下载图像吗?使用HTMLAgilityPack方法加载时怎么样?

回答

2

当使用WebClientWebRequestHtmlAgilityPack它只是HTML你将下载。

如果您想要图像(或其他资源),您必须在下载的文档中搜索图像URL并自行发出请求以获取它们。

如果你想试验一下,WebBrowser控件可以看一下。从那里,你可以采取Document财产,并看看它的属性Images并自己下载所有的图像。

你想做什么?

1

您下载该网站的HTML源,而不是整个网站。这是一个很大的区别。

看看如何使用HTML Agility Packthis one