hpricot

    0热度

    1回答

    我想刮下面的网站,因为XML的格式不正确,不包含所有的数据帧的数据进行解析,我需要: http://www.cafebonappetit.com/menu/your-cafe/pitzer 当我取与机械化的文件,但是,我只得到: {meta_refresh} {title "Collins | Claremont McKenna Cafés | Café Bon Appétit"} {ifra

    3热度

    1回答

    我使用Ruby的Hpricot gem来解析html。我想从文档中删除单个节点以供其他地方使用,但我找不到方法。 我看到,我可以删除元素的完整列表,使用角度来说,Hpricot ::元素(x = (doc/"div").remove)的实例,但我只想要删除的一审定标记的。 闲逛,我看到的建议,我只是一个注释节点或空格(x.inner_html = '')替换元素的内部文本,但不允许我利用节点的其他

    11热度

    1回答

    我正在使用Hpricot和OpenURI解析网页并从中提取网址。 当我得到像“http:rapidshare.com”这样的链接时,它不会重定向到https。 这是我得到的错误: /home/leonidus/.rvm/rubies/ruby-1.9.3-p125/lib/ruby/1.9.1/open-uri.rb:216:in `open_loop': redirection forbidd

    0热度

    2回答

    更新:此问题已使用相关DevKit的RubyInstaller和固定。请参阅下面的答案。 在新的WinXP,我们正在努力建立的回报率。我们在运行rails应用程序时遇到了一些问题。调试Hpricot宝石被发现是罪魁祸首。如果我们在一个简单的Ruby程序中使用Hpricot,会发生同样的问题。当我们运行其中使用角度来说,Hpricot任何Ruby程序与下面的消息会出现 一个消息框: The proc

    1热度

    1回答

    我运行下面的代码时出现以下错误: invalid byte sequence in UTF-8 (ArgumentError) 代码: require 'hpricot' require 'open-uri' doc = open('http://www.amazon.co.jp/') {|f| Hpricot(f.read) } puts doc.to_html 角度来说,Hpr

    3热度

    4回答

    正在以下过时的警告红宝石1.9.3-P125当我运行rspec的。但是,在Ruby 1.9.2中没有弃用的警告。 /gems/[email protected]/gems/soap4r-1.5.8/lib/xsd/iconvchars et.rb:9:in `<top (required)>': iconv will be deprecated in the future, use String

    0热度

    1回答

    从DIV内容使用角度来说,Hpricot我可以得到一些div的内容 - //这使以下 cillum dolore eu fugiat nulla pariatur. Excepteur sint occaecat cupidatat non proident, sunt in culpa qui officia deserunt mollit anim id est laborum. <br>

    0热度

    1回答

    我使用hpricot来处理一些外部生成的HTML。 什么是最简单的方法来找到一种类型的元素(在我的情况下:img)不是有一个其他类型的祖先(在我的情况下:p或div)? 我认为XPath表达式//img[not ancestors::div and not ancestors::p]应该做我正在寻找的东西。不幸的是,hpricot显然不支持祖先轴。据我所知,在CSS中没有“没有这样的祖先”操作符,

    2热度

    1回答

    我需要帮助来查找SVG(XML)文件中使用的所有颜色。 例如,我需要的图像http://upload.wikimedia.org/wikipedia/commons/e/e9/Pepsi_logo_2008.svg 我与角度来说,Hpricot /引入nokogiri宝石试图做类似中使用的颜色列表, - > doc.search(“[”填列:']“)..等 但我无法得到正确的结果。 如果有任何命令

    0热度

    1回答

    我有一个DOM,我想用Hpricot插入一个新节点。在这里我的DOM结构: <html> <head> </head> <body> ... ... </body> </html> 我想是我必须插入脚本标记为<body>有点像过去的孩子: <body> ... <script> console.log