我想知道如何从屏幕上获取信息以加入,以便最终可以将其放入CVS或数据库文件中。这只是一个例子,但是我选择测试的网站的实际数据。我测试了这些css调用以确保它们是有效的。提前感谢你的帮助。如何在Nokogiri HTML刮板中加入这些元素?
代码如下:
require 'rubygems'
require 'nokogiri'
require 'open-uri'
url = "http://neighbors.whitepages.com/search/neighbor_search/7707-Gralnick-Pl/Springfield,-VA"
doc = Nokogiri::HTML(open(url))
puts doc.at_css("title").text
doc.css(".header").each do |header|
address = header.css(".address").text
puts "#{address}"
end
doc.css(".household_members").each do |household_members|
names = household_members.css(".basic_info").text
puts "#{names}"
end
加入他们如何?你想如何格式化数据? – 2013-02-13 04:25:58
数据已分组为div,您只需遍历每个div。 – pguardiario 2013-02-13 05:05:55
最初,我只是将地址放在一列中,并将名称与名称列中的名字对应起来。最终所有名称在单独的列中与地址最多4个,并继续逐行处理到一个cvs文件或表。 – 2013-02-13 05:12:45