scrubyt

    1热度

    1回答

    使用scrubyt与Windows的Ruby 1.9.2,并呼吁Scrubyt :: Extractor.define时收到以下错误做 C:/Ruby192/lib/ruby/gems/1.9.1/gems/activesupport-3.0.9/lib/active_support/dependencies.rb:479:in load_missing_constant': Scrubyt::N

    0热度

    1回答

    我正在运行Windows XP。我刚刚安装了最新版本的Ruby(1.9) - Hpricot,Mechanize和Scrubyt,没有任何问题。我试图用我能找到的最简单的例子来使用scrubyt工作。例如: require 'rubygems' require 'scrubyt' data = Scrubyt::Extractor.define do fetch 'http://googl

    0热度

    1回答

    有谁知道如何让fill_textfield在query_field中接受big5编码的字符串?我不断收到“未终止字符串是否符合文件结束”错误与此: require 'rubygems' require 'scrubyt' search_data = Scrubyt::Extractor.define do fetch 'http://www.google.com/ncr'

    0热度

    1回答

    我尝试使用Scrubyt来浏览网站,但每当我用它来点击任何链接时,它都会给我403个禁止的错误。该网站不需要登录或任何东西,所以我不明白这一点。可能它需要某种会话变量或正确的UserAgent字符串。任何想法我可以解决这个问题?

    1热度

    4回答

    这可能与我之前的两个问题类似 - 请参阅here和here,但我试图使用_detail命令自动单击链接以便可以细节每个单独事件的页面。 我正在使用的代码是: require 'rubygems' require 'scrubyt' nuffield_data = Scrubyt::Extractor.define do fetch 'http://www.nuffieldtheat

    1热度

    1回答

    我已经写了一个基于'学习'技术的scrubyt提取器 - 也就是说,指定页面上的当前文本并使其找出XPath表达式本身。但是,我现在想要导出提取器,以便即使页面发生更改时也可以使用它。 scrubyt的文档似乎现在已遍布各地,但从我所能找到的,我应该能够把行extractor.export(__FILE__),它应该工作。它不 - 我只是得到一个错误,说有出口的参数数量错误,它应该有0.我已经尝试

    0热度

    3回答

    我遇到了一个不幸似乎无法超越的问题,不幸的是,问题 我试图刮网页如数字如下: http://www.yellowpages.com.mt/Malta/Grocers-Mini-Markets-Retail-In-Malta-Gozo.aspx 我想刮下一页在这种情况下是 http://www.yellowpages.com.mt/Malta/Grocers-Mini-Markets-Retai

    0热度

    1回答

    我绝不是Ruby的高手,而且对于Scrubyt来说还是比较新的。我只是试着在那里找到一些wiki页面的例子。我正在研究的例子是在搜索“ruby”时获得Google返回的搜索结果,并且我有了抓取每个结果的URL的想法,所以我可以继续并获取该页面。问题是我不知道如何适当地抓取URL。这是我下面的代码: require 'rubygems' require 'scrubyt' google_dat

    1热度

    4回答

    我试图将这段代码从scrubyt转换到nokogiri,并且试图将我的结果写入散列或xml。在scrubyt它看起来像如下: require 'rubygems' require 'scrubyt' result_data = Scrubyt::Extractor.define do fetch "http://rads.stackoverflow.com/amzn

    0热度

    1回答

    我现在用的是Scrubyt宝石,当我使用它,我得到这个错误: /home/bitnami/.rvm/gems/ruby-1.8.7-p352/gems/scrubyt-0.4.06/lib/scrubyt/core/navigation/agents/mechanize.rb:17:in `included': uninitialized constant Scrubyt::Navigation: