我在Perl中有一个小型的网页抓取工具,我正在考虑用JavaScript重新实现,以便与其他人分享。理想情况下,我想向他们发送一个页面,其中嵌入了完整的JavaScript程序,以便在他们自己的机器上独立运行。我需要能够存储运行结果。我期望能够找到一个RDBMS接口,如SQLite。我很惊讶,Firefox似乎没有这样的东西。就JavaScript的关系数据库存储解决方案而言,我在寻找什么?在JavaScript中存储网页抓取的输出
0
A
回答
0
这是一个稍微有点“问题范围之外”的答案,但最好查看一个已经处理XSS和RDBMS存储的免费抓取实用程序。查看WSO2的混搭服务器。
Link to Mashup Server Project Page
它使用的X系列(的XPath,XSLT,XML)采集格式和Javascript的任何业务逻辑。您可以将结果保存到数据库或将它们公开为Web服务。非常灵活的基于Java的解决方案。只需要一个JVM即可运行。
祝你好运!
1
您应该考虑在数据库服务器前面添加一个RESTful API。选择你的筹码。如果你没有和RDBMS结婚,可以考虑CouchDB,它有一个很棒的RESTful API。
1
一个稍微“里面最作用域的 - 你个问题”的答案是使用DB API像谷歌的API齿轮:Link to Gears
这提供了一个本地浏览器的存储解决方案。
相关问题
- 1. 抓取网页和存储链接
- 2. 在Python/R中的网页抓取javascript
- 3. 解析出网页抓取输出中的特定文本
- 4. 在iOS中抓取网页
- 5. 在PHP中抓取网页
- 6. 如何存储Scrapy抓取的网址?
- 7. python3中的网页抓取
- 8. 网页抓取/抓取的资源
- 9. 使用AWS的网页抓取与云存储
- 10. 控制使用jsoup抓取网页的输出
- 11. 网页抓取:按javascript按钮
- 12. 在PHP中抓取网页的照片
- 13. Beautifulsoup网页抓取
- 14. PHP网页抓取
- 15. Spyder - 网页抓取
- 16. Python:从网页抓取导出CSV
- 17. 在Python中屏幕抓取基于Javascript的网页
- 18. 从scrapy网站上抓取数据并输出到javascript
- 19. 先进的网页抓取
- 20. Python的SSL网页抓取
- 21. 在抓取的文件存储在Heritrix的网络爬虫
- 22. 在JavaScript中抓取/输入php变量?
- 23. r在网页中抓取(带循环)
- 24. Schtask保存网页输出
- 25. 在网页中抓取一些Javascript代码
- 26. 通过发布javascript在网页中抓取R:
- 27. 在Javascript中抓取网页时返回未知符号
- 28. Selenium/Web抓取/网页抓取Python中的应用程序
- 29. 在python下抓取IMDb的网页
- 30. 在txt模式下的网页抓取
您是否想过在浏览器的网页中运行此Javascript? –
如果您的目标是拥有一个托管您的代码的页面/网站,并允许在其他*域中搜索其他*网站,那么您将运行基本浏览器安全限制。 – Pointy
......但是如果你正在谈论的是如何从Node.js这样做的话,那么有各种各样的RDBMS连接器。 – Pointy