2009-07-27 51 views
0

我正在寻找一个http库(用于c#程序),这将允许我从网上下载一些html文档。我知道HttpWebRequest对象和.NET库提供的其他选项,但是,我需要更完整的解决方案,它能够处理不同的文档编码(有时编码是在文档本身而不是在Http中指定的头)。完整的Http库

谢谢。

回答

3

WCF Rest Starter Kit包含一个HttpClient类,它非常有用 - 它现在可用于.NET 3.5 SP1并且可以立即使用。由于它似乎被认为是一个有用的类,它可能最终会出现在基类库的.NET 4.0的将来版本中。

肯定也签出tutorial screencast亚伦Skonnard特色HttpClient的,并从WCF其他东西休息入门套件,以及其他WCF休息入门套件资源:

http://msdn.microsoft.com/en-us/netframework/cc950529.aspx

马克

+0

对于.NET 4.0而言,Downvoted并不是RTM,所以提问者可能无法在生产环境中使用几个月。 – 2009-07-27 18:20:36

1

Webclient班级提供您需要的一切。要处理特殊的编码情况,请将文档作为字节流下载,然后执行必要的操作。

0

sztomi是对的,Webclient类可能可以做你需要的。

如果您需要解析并与HTML工作,检查出的HTML敏捷性包(http://www.codeplex.com/htmlagilitypack

“这是一个灵活的HTML解析器,建立一个读/写DOM和支持纯XPath或XSLT(你实际上并不需要理解XPATH和XSLT来使用它,不用担心......)它是一个.NET代码库,它允许你解析“离开网页”的HTML文件,该解析器非常容忍“真实世界”格式错误的HTML。对象模型与提出System.Xml非常相似,但对于HTML文档(或流)。“