也许这听起来很天真,但是有一些东西甚至远远接近基于ajax的网站的php爬虫?基于ajax的网站的php爬虫?
3
A
回答
2
问题是,香草PHP不明白如何解析JavaScript,生成JavaScript环境,并与一切互动。为了在理论上做到这一点,您必须通过C API扩展PHP并将其与JavaScript库进行连接。这个规模很大,取决于你有多少资源。
2
不是自动爬虫,因为他们需要了解JavaScript代码并需要知道发生了什么。
他们可以做的是使用与启用ajax的脚本相同的调用,因此您可以获取原始数据。
但是,这意味着您需要对网页及其调用的网址有非常好的理解,并且相当费力。
所以答案是:不,据我所知,它们不存在。
0
你可以使用phantomjs库来执行js。
https://github.com/ariya/phantomjs/blob/master/examples/waitfor.js
相关问题
- 1. PHP网络爬虫
- 2. python网站爬虫(多个网站)
- 3. PHP与Python对于网络爬虫
- 4. 单页网页爬虫PHP
- 5. 让PHP网络爬虫尊重任何网站的robots.txt文件
- 6. 。基于网络的网络爬虫示例
- 7. 网络爬虫
- 8. 网络爬虫抓取基于AJAX的链接没有浏览器
- 9. 反向链接报告网站爬虫?
- 10. 运行一个网站爬虫
- 11. java网络爬虫
- 12. Python网络爬虫
- 13. php爬虫检测
- 14. 网站爬虫的大网站抓取网站状态,标题和h1
- 15. 针对windows的增量爬网支持的网络爬虫
- 16. 需要网络爬虫
- 17. 自动网络爬虫
- 18. 网络爬虫,反馈?
- 19. 网络爬虫不打印
- 20. 网络爬虫应用
- 21. 网络爬虫提取
- 22. ajax网站(调制解调器路由器设置)中的Python爬虫
- 23. 与ajax一起工作的网页报废/爬虫
- 24. 如何测试基于Ajax的网站?
- 25. 如何为使用oauth2的网站构建Python爬虫
- 26. 如何检查我的网站是否使用爬虫访问?
- 27. asp.net mvc网站搜索使用网络爬虫
- 28. 网络爬虫,它检索网站源代码
- 29. 使用DOM从外部网站选择性提取数据PHP网络爬虫
- 30. 在Scala中的网络爬虫算法
这不是PHP的,所以我不提供它作为一个答案,但在的HtmlUnit Java是完全脚本模拟浏览器组件,完全与JS的支持 - 可作为一个履带式了。 – Piskvor 2011-05-20 11:02:26