提取自特定页面所有的HTML标签在Ruby

我需要从网页中的所有HTML标签提取到一个数组中不使用水豚标签中的数据在Ruby中提取自特定页面所有的HTML标签在Ruby

2016-05-29 Subha

我很好奇，你尝试过什么？ – vol7ron

可以使用nokogiri宝石。

require 'nokogiri' 
require 'open-uri' 

# Fetch and parse HTML document 
doc = Nokogiri::HTML(open('http://www.google.co.in')) 

# To list all anchor tags, do: 
doc.search('a').each{ |x| puts x.inspect }

来源

2016-05-29 07:43:30

尝试这水豚

find(:xpath, "//*")

来源

2016-05-29 15:16:14 nickcen

提取自特定页面所有的HTML标签在Ruby

回答

相关问题