到目前为止,我一直使用wget和curl来做屏幕抓取。现在我想切换到Perl。什么是一个很好的教程,将涵盖perl中的基本web编程(最好不要重述基础知识)?我说的是基本的东西,喜欢把自己和解析页面,提交表单,代理等perl网络教程
Q
perl网络教程
1
A
回答
0
工具,你需要的Perl之外:
- HTTP实时头(Firefox扩展)或当量。以反向工程JavaScript请求原始GET/POST,所以你可以模仿与Mechanize或LWP等
- 正如其他海报已经提到的,一个好的无头浏览器是
WWW::Mechanize
模块。 - 我建议花一些时间学习
HTML::TreeBuilder
&特别是HTML::TreeBuilder::XPath
和HTML::Query
。当您希望从HTML文档获取实际数据时,最后两个将变得非常方便。 HTML::TableExtract
也是一个很好的模块,可以在需要时从HTML表格中提取数据。
基本上,使用上述所有功能将使您能够抓取大多数网站。
有乐趣爬行( - :
1
2
我过去使用过WWW-Mechanize来实现基本的网页抓取功能,包括表单提交等。
还有一些不错的examples。
相关问题
- 1. 是否有关于Perl网络编程的最新教程?
- 2. 贝叶斯网络教程
- 3. Asp.net网络服务视频或教程
- 4. 亚马逊网络服务+ iphone教程
- 5. 寻找Drupal网络形式教程
- 6. TensorFlow卷积Nueral网络教程
- 7. C/C++/C#TCP/IP和网络编程(多平台)的教科书或教程
- 8. 神经网络教学:双极XOR
- 9. Tensorflow无法运行广泛而深入的网络教程
- 10. 语言独立教程或网络应用书
- 11. 寻找一个简单的Python/MongoDB的网络教程
- 12. 关于使用PHP和MySQL创建社交网络的教程?
- 13. 什么是iPhone上的点对点网络的好教程?
- 14. 有创建贝叶斯网络的一步一步教程吗?
- 15. Google Compute Engine Bookshelf教程:npm ERR!网络阅读ECONNRESET
- 16. 春季:有没有简单的非网络教程?
- 17. Firefox网络扩展教程:剧本重演
- 18. MVC3网络应用程序/教程将不会“在IIS7网络服务器上使用ASPNETDB.mdf”登录“
- 19. 网络流程
- 20. Perl IO :: Socket :: SSL:connect:网络无法访问
- 21. 建议想:网络蜘蛛用Perl
- 22. Perl:保存图像从网络
- 23. 网络/网络编程与Python
- 24. 的Java EE网站教程
- 25. Bootstrap设计网站教程
- 26. JBoss教程,门户网站
- 27. 很好的教程或指南移动网络iPhone应用程序
- 28. 针对(短期)非网络程序员需要一个快速的C#教程
- 29. Unix网络编程
- 30. ASP.Net网络流程
网络::查询支持比HTML ::查询更复杂的选择,因为它没有实现这种对自己,但代表这一部分,以优良的功能完整的HTML ::选择:: XPath的。 – daxim 2011-05-18 11:08:12