像PHP中的DOMDocument类,是否有RUBY中的任何类(即核心RUBY),用于从HTML文档中解析和获取节点元素值。在Ruby中解析HTML文档的方法?
回答
有没有内置的HTML解析器(但),但一些非常好的可用,特别是Nokogiri。
元回答:对于这些常见的需求,我建议您查看Ruby Toolbox网站。您会注意到Nokogiri是HTML parsers的最佳推荐
您应该检查出hpricot。它非常好。这不是'核心'红宝石,但它是一个常用的宝石。
您也可以尝试Oga Yorick Peterse。
这是一个用Ruby编写的XML/HTML解析器,它不需要像libxml这样的系统库。你可以在这里找到它。 https://github.com/YorickPeterse/oga
Ruby Cheerio - Ruby中的jQuery风格的HTML分析器。用于爬虫的Nokogiri的最简化版本。这是最流行的NodeJS包的红宝石版本cheerio。
Follow the link for a simple crawler example.
宝石安装红宝石cheerio
require 'ruby-cheerio'
jQuery = RubyCheerio.new("<html><body><h1 class='one'>h1_1</h1><h1>h1_2</h1></body></html>")
jQuery.find('h1').each do |head_one|
p head_one.text
end
# getting attribute values like jQuery.
p jQuery.find('h1.one')[0].prop('h1','class')
# function chaining similar to jQuery.
p jQuery.find('body').find('h1').first.text
非常好的方法!不错的推荐!谢谢@dineshsprabu。 – 2017-04-18 19:22:23
谢谢费尔南多·科什 – dineshsprabu 2017-04-19 07:29:41
- 1. 解析HTML文档?
- 2. 解析Ruby中的XML文档
- 3. 解析HTML文档PHP
- 4. 方法解析文档和规范行
- 5. 如何用ruby解析word文档?
- 6. 使用Ruby循环解析XML文档
- 7. Ruby解析CSS文件的HTML
- 8. 解析HTML与引入nokogiri在Ruby中
- 9. 用ruby解析javap的方法名称
- 10. 从服务器解析HTML文档
- 11. 使用NekoHTML解析html文档
- 12. 使用HtmlAgilityPack-Xpath解析HTML文档,RegExp
- 13. 解析HTML/XML文档如何工作?
- 14. 用xmlpullparser解析html-like文档?
- 15. 使用PHP解析HTML文档
- 16. 如何使用c解析html文档#
- 17. 关于“解析器”方法的文档在哪里?
- 18. Ruby Nokogiri解析HTML表
- 19. 解析jsbin输出html文档的'javascript'字段内容的方法
- 20. 解析在Ruby中
- 21. 解析在Ruby中
- 22. 解析HTML文档后无法获得预期的数据
- 23. 解析HTML文档并替换整个标签片段的最佳方法
- 24. 解析文档,C
- 25. 解析XML文档
- 26. Dom文档解析
- 27. 解析XML文档
- 28. 解析XML文档
- 29. 解析Office文档
- 30. 在HTML中嵌入文档(html/pdf/swf/...)的统一方法
角度来说,Hpricot可悲的是没有更多的。 Nokogiri现在是首选解决方案。 – superluminary 2013-10-14 11:27:44