2012-02-18 65 views
0

假设我有解析HTML的行了下面......解析只是在Ruby中通过引入nokogiri在HTML节点的内容

<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a> 

这仅仅是一个例子...但我怎么会去剥离一切除了以下内容:

http://www.google.com 
logo.png 
Go to google! 

此外,是否有可能搜索通配符?

回答

1

也许是这样的:

doc = Nokogiri::HTML '<a href="http://www.google.com" class="blah"><img src="logo.png" border="0"></img><br><span class="red">Go to google!</span></a>' 
doc.xpath('//*/@href|//*/@src|//*/text()').map(&:to_s) 
+0

这将赶上通配符? – user1015523 2012-02-18 15:45:16

+0

我不确定你的意思是通配符 – pguardiario 2012-02-18 23:13:21