我工作的公司将其前端切换到gwt应用程序,我想知道是否有可能编写一个脚本(无论是与bash和wget或cURL,或Java或其他),使我下载gwt web应用程序的实际内容。因为现在如果我尝试使用诸如wget之类的命令,我只是使用一些javascript函数下载页面,但没有实际的页面内容(我感兴趣的内容)。我在质量保证方面,所以我想我很想知道是否有可能在没有直接访问开发者代码的情况下执行这样的任务。 谢谢!下载网页谷歌网络工具包
1
A
回答
0
我发现用一种叫做硒工具的解决方案。我能够轻松点击应用程序中的gwt应用程序记录我的活动以供将来使用,并获取应用程序生成的实际html,然后我可以解析所需内容并据此采取相应措施。唯一的小缺点是硒不需要使用htmlunit或httpunit,而需要使用浏览器。
1
GWT使用javascript构建页面(DOM)。所以哟需要渲染初始DOM的东西,运行改变/生成元素的javascript,然后输出整个DOM。基本上你需要一个浏览器。
你最好的选择是寻找一个保存整个页面的浏览器扩展。
0
以下是关于AJAX应用程序中的可爬行性的一般背景。
http://code.google.com/web/ajaxcrawling/docs/getting-started.html
这里是通过喂养页面到的HtmlUnit,导致所有的HTML被渲染,然后把结果发回给网络爬虫实现了爬行规范样本servlet代码。
相关问题
- 1. 谷歌网络工具包
- 2. 谷歌网络工具包与单轨
- 3. 谷歌网页工具包 - 多页
- 4. java +谷歌网络工具包(谷歌应用程序引擎)
- 5. 谷歌网络工具包评估字符串
- 6. 在谷歌网络工具包eclipse插件
- 7. 谷歌网站索引(谷歌网站管理员工具)
- 8. 谷歌浏览器 - 开发人员工具 - 网络面板
- 9. 谷歌网络工具包 - 从Java发送字符串到JavaScript代码
- 10. 谷歌小工具和网站api
- 11. 谷歌网站管理员工具API
- 12. 将重定向页面,谷歌网站管理员工具
- 13. 将谷歌小工具添加到网页
- 14. 谷歌网站管理员工具API:通过OAUTH2下载查询
- 15. 谷歌网页索引
- 16. 如何谷歌网页
- 17. 谷歌网页字体 - CSS
- 18. 谷歌网站管理员工具:网站地图不索引?
- 19. 下载网页
- 20. 谷歌网站字体谷歌网站
- 21. 如何将网页转换为JavaScript/Google网络工具包中的图像
- 22. 无法下载谷歌数据蟒蛇库/链接谷歌网站文档页面不工作
- 23. 网络发现工具 - java
- 24. 网络管理工具
- 25. 网络追踪工具
- 26. 网络刮python的谷歌新闻
- 27. 谷歌地图网络服务Api
- 28. PHP提取谷歌网络历史
- 29. 谷歌网络搜索API限制
- 30. 横跨谷歌云网络项目
感谢您的回复,我之前实现了HTMLUnit代码,尝试从我正在测试的应用程序生成html,但它不生成应用程序的任何实际body html,它只是返回头部提及的内容javascript和css引用。我需要再看看这个,看看我是否可以调整服务器请求或类似的东西。我相信这是可以做到的,因为使用萤火虫我可以查看应用程式的HTML,我只是没有想出HTMLUnit。 – mike 2011-06-03 16:06:46