我已经多次使用scrapy和美丽的汤,但是更容易和更快速地找到kimonolabs解决方案。唯一的问题是,有时候作业需要一些调整,这是不可能的(例如,使用独特模式进行爬取)。是否有像KimonoLabs这样的刮板应用程序?
是否有其他解决方案将易用性和可选复杂性结合起来?主要是我想用一个WYSIWYG接口定义一个页面抓取模板,然后以编程方式编写抓取器。
我已经多次使用scrapy和美丽的汤,但是更容易和更快速地找到kimonolabs解决方案。唯一的问题是,有时候作业需要一些调整,这是不可能的(例如,使用独特模式进行爬取)。是否有像KimonoLabs这样的刮板应用程序?
是否有其他解决方案将易用性和可选复杂性结合起来?主要是我想用一个WYSIWYG接口定义一个页面抓取模板,然后以编程方式编写抓取器。
完全披露:我是ParseHub的创始人之一。
ParseHub试图解决这个问题。它为您提供了一个gui和强大的工具,用于直观地定义模板,如果您需要更细致的控制,则可以回到javascript的子集。所有您熟悉的编程原语(如果,打破,递归等)都可用。
您可以在www.parsehub.com
使用的Import.io提取找到它。
看起来不错,我会很乐意给它一个尝试,但我在OSX :( – user2808117 2016-02-28 00:31:39
将隆重推出REST API和门户网站即将推出可以在任何操作系统上工作,在网站上注册并且所有用户都将获得发送的电子邮件:) – 2016-02-28 03:53:13