2011-03-28 31 views
0

我试图解析这个ARIN XML文档。我想获得orgRef标签里面的“名称”属性,并没有做什么,我希望当我角度来说,Hpricot红宝石角度来说,Hpricot解析XML文档ARIN

<?xml version='1.0'?><?xml-stylesheet type='text/xsl' href='http://whois.arin.net/xsl/website.xsl' ?><nets xmlns="http://www.arin.net/whoisrws/core/v1" xmlns:ns2="http://www.arin.net/whoisrws/rdns/v1" termsOfUse="https://www.arin.net/whois_tou.html"><limitExceeded limit="256">false</limitExceeded><net termsOfUse="https://www.arin.net/whois_tou.html"><registrationDate>1998-04-18T00:00:00-04:00</registrationDate><ref>http://whois.arin.net/rest/net/NET-205-188-0-0-1</ref><ns2:delegations termsOfUse="https://www.arin.net/whois_tou.html"><ns2:delegationRef name="188.205.in-addr.arpa.">http://whois.arin.net/rest/rdns/188.205.in-addr.arpa.</ns2:delegationRef></ns2:delegations><endAddress>205.188.255.255</endAddress><handle>NET-205-188-0-0-1</handle><name>AOL-DTC</name><netBlocks><netBlock><cidrLength>16</cidrLength><endAddress>205.188.255.255</endAddress><description>Direct Assignment</description><type>DS</type><startAddress>205.188.0.0</startAddress></netBlock></netBlocks><pocs termsOfUse="https://www.arin.net/whois_tou.html"><pocLinkRef handle="AOL-NOC-ARIN" function="T" description="Tech">http://whois.arin.net/rest/poc/AOL-NOC-ARIN</pocLinkRef></pocs><orgRef name="America Online, Inc" handle="AMERIC-59">http://whois.arin.net/rest/org/AMERIC-59</orgRef><parentNetRef name="NET205" handle="NET-205-0-0-0-0">http://whois.arin.net/rest/net/NET-205-0-0-0-0</parentNetRef><startAddress>205.188.0.0</startAddress><updateDate>1998-04-27T00:00:00-04:00</updateDate><version>4</version></net></nets> 

我这样做解析它:

doc = Hpricot(contents) 
(doc/:orgRef).each do |orefRef| 
    puts "FOUND ELEMENT!" 
end 

当我做( doc /:net),它输出的东西,但由于某种原因,它无法找到该单一元素。有任何想法吗。我也尝试(doc /:net/orgRef)。这是怎么回事? ARIN有意让这个XML无法解析吗?

+0

我建议考虑引入nokogiri作为替换对角度来说,Hpricot,应该改变你的初始化后是一个下拉到'doc = Nokogiri :: XML(内容)'。它非常强大并得到很好的支持。 Hpricot在使用XML时遇到了一些问题,包括完全崩溃。我从来没有像Nokogiri那样的问题。 – 2011-03-28 05:54:43

+0

谢谢,我想先使用Nokogiri,但是在安装到我的Mac时遇到了麻烦。涉及体系结构的奇怪的依赖性问题。 – 2011-03-28 15:47:16

+0

我在两台Mac和几台运行不同发行版的Linux机器上使用它,没有任何问题。随意创建一个新问题,我们会看看我们是否可以帮助解决问题。 – 2011-03-28 22:47:01

回答

0

没关系。我知道了。我不得不这样做ipWebHost =(DOC /“网/ orgRef”)[0] [“名”]