2011-06-21 42 views
0

我想从超链接中获取实际的url字符串。我想我的结果被剥离的HTML。如何从使用hpricot的超链接中提取网址?

所以,如果我的输入字符串中的一个是

<a href="http://target.com/resource.tar.gz">resource</a> 

我想获得:

http://target.com/resource.tar.gz 

我怎样才能做到这一点?

回答

1

在Hpricot中,您可以使用方括号访问元素的属性(就像访问Hash中的元素一样)。所以,用你的例子:

doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>') 

puts doc.at('a')['href'] # => http://target.com/resource.tar.gz 
相关问题