这是我正在扫描的HTML的一个示例。如何用Nokogiri抓取多个模式的实例?
<div class="text">
<h3>
<a href="http://www.faith.co.uk/">
Rodeo Sinclair
</a>
</h3>
.
.
.
h3>
<a href="http://www.hate.co.uk/">
Morvern
</a>
</h3>
这是我的代码。
require 'nokogiri'
require 'open-uri'
doc = Nokogiri::HTML(open(url))
output = doc.css('div h3 a').attr("href")
问题是,它只输出第一个url。我如何获得这两个?
如果存在该模式的多个实例(在您的情况下为'div h3 a'),那么'css'应该返回一个'NodeSet',您可以遍历它。 – itdoesntwork 2012-02-10 13:49:47