2010-05-29 36 views
1

我已经写了一个基于'学习'技术的scrubyt提取器 - 也就是说,指定页面上的当前文本并使其找出XPath表达式本身。但是,我现在想要导出提取器,以便即使页面发生更改时也可以使用它。如何导出scrubyt提取器?

scrubyt的文档似乎现在已遍布各地,但从我所能找到的,我应该能够把行extractor.export(__FILE__),它应该工作。它不 - 我只是得到一个错误,说有出口的参数数量错误,它应该有0.我已经尝试过它没有任何参数,它仍然失败。

我会问在scrubyt论坛,但它似乎没有人在那里很长一段时间!

任何想法在这里做什么?

回答

1

刚刚有同样的问题,并试图“把google_data.export()”(试图从谷歌获得一些东西)

这给了我如下:

===提取树= ==

export() is not working at the moment, due to the removal or 

ParseTree,ruby2ruby和RubyInline。 现在,如果您正在使用示例,您可以根据以下输出,用手 替换它们。 因此,如果您在学习提取图案看起来像

book "Ruby Cookbook" 

and you see the following below: 

[book] /table[1]/tr/td[2] 

then replace "Ruby Cookbook" with "/table[1]/tr/td[2]" (and all the 

其他的XPath),你准备好了! [链接] /体/ DIV/DIV/DIV/DIV/DIV /醇/ LI/H3/A

这给了我,我一直在寻找

scrubyt版本的XPath是0.4.06