是否有可能使用c#抓取用户认证的网站?WebCrawling用户认证的网站
回答
要抓取用户认证的网站,您的抓取工具应该能够处理cookie和POST请求。
现在的问题是:你想让你的抓取工具注册,通过电子邮件验证自己,然后登录抓取所有内容?
我已经拥有凭据,我认为它使用表单身份验证。我可以使用c#套接字来执行此操作吗?我应该使用哪些命令?谢谢... :) – Jojo 2010-07-31 08:17:32
我想你可以使用** WebClient **或** HttpWebRequest **,正如@Darin Dimitrov所示。 – 2010-07-31 08:24:03
是的,套接字是一个坏主意,很多工作没有理由(除非你有一个当然?)。如果你也在问'我应该使用什么命令',那么这听起来像你没有阅读过HTTP协议;在这种情况下使用.NET Web类是一个更好的主意 – 2010-07-31 08:26:29
- 1. 在其他网站上认证用户帐户的策略?
- 2. 在网站的SSL认证
- 3. 网站性能认证
- 4. 关于网站用户认证的PHP最佳实践?
- 5. 我的网站/家认证用户和匿名
- 6. 如何使用FORM认证从网站注销用户?
- 7. 试图从非SSL认证网站重定向到SSL认证网站
- 8. 如何检测网站上的谷歌AdSense广告通过webcrawling
- 9. Laravel验证网站所属的用户
- 10. 从“网站b”的“网站a”检查用户身份验证
- 11. 只有一个网站的openam认证
- 12. 寻找HTTP认证网站的例子
- 13. 用户认证
- 14. Firebase推特认证和跨网站scription
- 15. 跨产品网站认证系统
- 16. 网站谷歌认证与火力
- 17. 谷歌网站管理员API认证
- 18. 第三方网站认证库(如openid)
- 19. GAE认证到第三方网站
- 20. REST Web服务 - 网站认证
- 21. Perl:HTML从认证网站上刮掉
- 22. 如何为我的网站创建需要用户认证的Bookmarklet
- 23. 我们如何跟踪没有认证系统的网站的用户流量?
- 24. 认证后的网站阅读网站是否有效或不使用C#
- 25. 网站的用户帐户
- 26. Azure网站的客户端SSL证书
- 27. 基本认证。服务器上每个网站的一个用户
- 28. 使用Gmail账户和googleplus账户认证用户到我的网站之间的区别
- 29. Silverlight用户认证
- 30. Mongoengine用户认证
为什么你想使用套接字?你必须做的每件事情都是为了你的HTTP请求使用套接字。那么使用套接字的目的是什么? – 2010-07-31 08:23:07
我已经有一个使用c#套接字的webcrawler。我尝试了.NET的HTTP和WebClient,但他们似乎使用更多的CPU和内存,我不能使用多线程。 – Jojo 2010-07-31 08:28:20
使用'WebClient'的正确编写的爬虫实现不会使用更多的内存和CPU(或者至少没有明显的区别),当然你可以使用'WebClient'实现多线程,只需要为每个线程使用多个实例。 'WebClient'也有异步方法。 – 2010-07-31 08:31:32