是否有执行Ajax和不使用一种自动的Web浏览器或没有外部库做旧的方式 检索结果AJAX一个简单的方法? 它有一些先进的算法,它做到这一点?网络爬虫抓取基于AJAX的链接没有浏览器
0
A
回答
0
我不知道有什么方法可以做到这一点,无需任何外部库,但为的HtmlUnit大(java写的),有一个C#包装,你可以试一下:https://github.com/HtmlUnit/NHtmlUnit
0
尝试Nutch的。一般来说,所有不受robots.txt限制的内容,不需要用户输入,都可以通过抓取工具进行抓取。
2
没有。 JS代码需要在本地编译,然后在本地执行。
代码:https://svn.arachnode.net/svn/arachnodenet/trunk/Renderer/ UN/PW:公共/公共
您可以从SVN客户端获取路径,去掉Arachnode *引用,并有一个快速的JavaScript解释器。它使用mshtml.dll,它支持为.NET WebBrowser控件提供动力的AxShDocVw.dll,比.NET控件快大约6倍。
https://svn.arachnode.net/svn/arachnodenet/trunk/Renderer/HtmlRenderer.cs首先仔细阅读该文件。
谢谢, 迈克
相关问题
- 1. 基于ajax的网站的php爬虫?
- 2. 网络爬虫
- 3. 网络爬虫提取
- 4. 。基于网络的网络爬虫示例
- 5. 抓取一些链接后网站禁止爬虫
- 6. 浏览器限制是否影响网络爬虫?
- 7. Python网络爬虫没有输出
- 8. PHP网络爬虫
- 9. java网络爬虫
- 10. Python网络爬虫
- 11. 在抓取的文件存储在Heritrix的网络爬虫
- 12. 网络抓取链接表
- 13. 网络爬虫是否仅依靠主页上的链接来进行爬网?
- 14. PHP与Python对于网络爬虫
- 15. 需要网络爬虫
- 16. 自动网络爬虫
- 17. 网络爬虫,反馈?
- 18. 网络爬虫不打印
- 19. 网络爬虫应用
- 20. Scrapy网络爬虫获取错误
- 21. 如何使网络爬虫更有效?
- 22. 反向链接报告网站爬虫?
- 23. 筛选出用于Python的图像/文件链接机械化网络爬虫
- 24. 最好的网络爬虫 - 用于内容提取
- 25. 如何让Nutch的爬虫抓取
- 26. 使用网络爬取器抓取网页数据
- 27. Python的网络爬虫(NameError:名字“蜘蛛”没有定义)
- 28. 针对windows的增量爬网支持的网络爬虫
- 29. 在Scala中的网络爬虫算法
- 30. 在android上的简单网络爬虫?
感谢小费,我会试试看。 – 2013-02-16 09:47:27