我想知道是否有类似Scrapy for nodejs的东西?如果不是,你认为使用简单的网页下载和使用cheerio解析它?有没有更好的办法。Scrapy就像Nodejs的工具?
5
A
回答
1
我还没有见过如此强大的解决方案,用于在Python中抓取/索引整个网站,如Scrapy,所以我个人使用Python Scrapy来抓取网站。
但是对于从页面中抓取数据,在nodejs中有casperjs。这是一个非常酷的解决方案。它也适用于ajax网站,例如角-js页面。 Python Scrapy无法解析ajax页面。 因此,为了抓取一页或几页的数据,我更喜欢使用CasperJs。
Cheerio确实比casperjs更快,但它不适用于ajax页面,并且它没有像casperjs这样的良好代码结构。所以我更喜欢casperjs,即使你可以使用cheerio包。
咖啡脚本实例:
casper.start 'https://reports.something.com/login', ->
this.fill 'form',
username: params.username
password: params.password
, true
casper.thenOpen queryUrl, {method:'POST', data:queryData}, ->
this.click 'input'
casper.then ->
get = (number) =>
value = this.fetchText("tr[bgcolor= '#AFC5E4'] > td:nth-of-type(#{number})").trim()
0
万一你仍然需要一个答案, https://www.npmjs.org/package/scrapy 我从来没有测试过它,但认为它可以帮助。 快乐报废。
相关问题
- 1. Scrapy命令行工具未安装pip
- 2. iOS工具栏就像一个标签栏
- 3. 应用的NodeJS作为CLI工具
- 4. Windows Azure平台就绪测试工具
- 5. 如何实现就地工具提示
- 6. 在全局搜索工具上工作 - 就像在MAC上一样
- 7. 可以在网络上使用NodeJs,就像php
- 8. 是否有T-SQL的样式检查工具,就像FxCop到.net一样?
- 9. 是否有网络调试工具栏的春天,就像在symfony和Django?
- 10. 的SQLite就像%和_
- 11. 在scrapy中放入我的抓取工具的参数
- 12. 显示图像具有不同大小就像一个表CSS
- 13. Scrapy图像下载
- 14. 访问像MySQL的工具
- 15. scrapy和铬工具不会返回相同的值
- 16. Scrapy SitemapSpider不工作
- 17. Scrapy xpath不工作
- 18. Data.JS/NowJS/NodeJS生产就绪技术?
- 19. Db的迁移 - 休眠/ JPA - 就是hbm2ddl - 差异工具
- 20. 部署生产就绪OpenStack集群的最佳工具
- 21. ASP.NET SqlDataSource,就像SelectCommand
- 22. 就像在ActiveDirectory中
- 23. 就像在SQL Server
- 24. jquery工具 - 多个工具提示,不同的图像
- 25. C#winform:像Visual Studio工具条一样的浮动工具条
- 26. MySQL的选择就像
- 27. 制作就像yahoomail,Gmail的
- 28. 的Facebook就像在PHP
- 29. 的Facebook就像请求
- 30. Scrapy网页抓取工具无法抓取链接
该模块不能被配置。它只返回商家名称和电话。我发现了一个可能的解决方案,而不像Scrappy那样。但通过使用Cheerio可以操作页面。就像使用Jquery一样。 – user2422940 2014-12-02 17:59:20