2
我有一个包含多个学生姓名的页面,每个学生都有一个导致他图表的URL。在HTML看起来像这样:用水豚提取url
<div class="student_name">
<a target="_blank" data-tn-element="grade-result-link[]" data-tn-link
href="/johndoe/b89db3308ddaaed2?sp=0" rel="nofollow" class="student_link"
itemprop="url">John Doe</a>
<span class="graduated"> - Graduated 2013</span>
</div>
我想创建一个网页上的每个学生的唯一的URL列表,但我最终得到的是学生的名字。我使用的是水豚用WebKit和我的代码类似于此:
results = page.all('div.student_name').map do |item|
puts(item.text)
end
我怎么这句话,所以我只能在href提取嵌入的(相对)的网址?
埃德
真棒...只是我需要的kickstart。 – firedude144