2011-01-28 101 views
5

我已经编写了以下代码以从网页获取内容并保存到系统中。 如果网页是html格式,我可以保存它。 如果网页是pdf格式,我无法保存。保存后如果我打开文件空白页即将到来。使用http响应如何保存pdf文件

我想知道如何从响应中保存pdf文件。

HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(Url); 
WebResponse response = request.GetResponse(); 
Stream stream = response.GetResponseStream(); 
StreamReader reader = new StreamReader(stream); 
webContent = reader.ReadToEnd(); 
StreamWriter sw = new StreamWriter(FileName); 
sw.WriteLine(webContent); 
sw.Close(); 

请尽快帮我。

回答

13

StreamReader.ReadToEnd()返回一个字符串。 PDF文件是二进制文件,并包含不友好字符串的数据。您需要将它读入一个字节数组,并将字节数组写入磁盘。更好的是,使用较小的字节数组作为缓冲区并以小块读取。

您还可以通过只使用Web客户端简化了整个事情:

using (var wc = new System.Net.WebClient()) 
{ 
    wc.DownloadFile(Url, FileName); 
} 
+0

PDF文件_usually_二进制的,不是吗?由于它基于[PostScript](http://en.wikipedia.org/wiki/Portable_Document_Format#PostScript),它可以只是文字,我猜也是。 – 2011-01-28 05:47:23

6
HttpWebRequest request = (HttpWebRequest)HttpWebRequest.Create(Url); 
WebResponse response = request.GetResponse(); 

using (Stream stream = response.GetResponseStream()) 
using (FileStream fs = new FileStream(FileName, FileMode.Create, FileAccess.Write, FileShare.None)) 
{ 
    stream.BlockCopy(fs); 
} 

... 
public static class StreamHelper 
{ 
    public static void Copy(Stream source, Stream target, int blockSize) 
    { 
     int read; 
     byte[] buffer = new byte[blockSize]; 
     while ((read = source.Read(buffer, 0, blockSize)) > 0) 
     { 
      target.Write(buffer, 0, read); 
     } 
    } 
    public static void BlockCopy(this Stream source, Stream target, int blockSize = 65536) 
    { 
     Copy(source, target, blockSize); 
    } 
}