如何从使用hpricot的超链接中提取网址？

我想从超链接中获取实际的url字符串。我想我的结果被剥离的HTML。如何从使用hpricot的超链接中提取网址？

所以，如果我的输入字符串中的一个是

<a href="http://target.com/resource.tar.gz">resource</a>

我想获得：

http://target.com/resource.tar.gz

我怎样才能做到这一点？

2011-06-21 Robert

在Hpricot中，您可以使用方括号访问元素的属性（就像访问Hash中的元素一样）。所以，用你的例子：

doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>') 

puts doc.at('a')['href'] # => http://target.com/resource.tar.gz

2011-06-21 07:52:54

回答