0
我想从超链接中获取实际的url字符串。我想我的结果被剥离的HTML。如何从使用hpricot的超链接中提取网址?
所以,如果我的输入字符串中的一个是
<a href="http://target.com/resource.tar.gz">resource</a>
我想获得:
http://target.com/resource.tar.gz
我怎样才能做到这一点?
我想从超链接中获取实际的url字符串。我想我的结果被剥离的HTML。如何从使用hpricot的超链接中提取网址?
所以,如果我的输入字符串中的一个是
<a href="http://target.com/resource.tar.gz">resource</a>
我想获得:
http://target.com/resource.tar.gz
我怎样才能做到这一点?
在Hpricot中,您可以使用方括号访问元素的属性(就像访问Hash中的元素一样)。所以,用你的例子:
doc = Hpricot('<a href="http://target.com/resource.tar.gz">resource</a>')
puts doc.at('a')['href'] # => http://target.com/resource.tar.gz