0
我需要从网页中的所有HTML标签提取到一个数组中不使用水豚标签中的数据在Ruby中提取自特定页面所有的HTML标签在Ruby
我需要从网页中的所有HTML标签提取到一个数组中不使用水豚标签中的数据在Ruby中提取自特定页面所有的HTML标签在Ruby
可以使用nokogiri宝石。
require 'nokogiri'
require 'open-uri'
# Fetch and parse HTML document
doc = Nokogiri::HTML(open('http://www.google.co.in'))
# To list all anchor tags, do:
doc.search('a').each{ |x| puts x.inspect }
尝试这水豚
find(:xpath, "//*")
我很好奇,你尝试过什么? – vol7ron