2011-11-16 59 views
1

我正在构建一个将从多个不同来源导入产品的网站。我将从一些XML导入开始,稍后我可能不得不实现CSV导入。它会从URL中提取XML,然后检查每个帖子,看看产品是否已经存在,如果有,请检查价格并在更改后更新。我听说过关于Nokogiri的好消息,并将其用于XML解析。我将使用Rails 3.1.1。使用Rails从XML和CSV导入

我对Rails很新,有一些问题。我试图建立这个学习Rails的应用程序,并尝试一些TDD。

我应该建立导入脚本作为rake任务吗?这是一个好方法吗? 如何定期运行这些?我是否像在PHP中那样设置cronjob?

XML资源将在结构,元素名称等方面有所不同,所以我想我将不得不为每个源创建一个导入脚本。这是一个好方法,还是我可以创建一个更通用的导入脚本,并以某种方式将不同的元素映射到我的数据库中的正确列?

很多问题......我希望有人能给我一些提示,并朝正确的方向踢我。

感谢, 莱纳斯

回答

0

很多的问题,我会尽力回答其中的一些。

Nokogiri是一个不错的选择。

是的,你可以运行脚本作为cron作业,或者你可以设置一个常规rails守护进程(谷歌它)有很多选项可用,这取决于你希望运行多久,或者你想怎么样设置它。我已经将这些东西创建为rake任务,然后将cron设置为定期运行rake任务。如果你对rake和cron感到满意,这是一个好主意。

是的,你可能会找到方法来组合相似的XML脚本。你的Rake任务将会是ruby--没有什么能阻止你测试XML是什么类型的,然后在你编写的库中的模块中调用合适的方法来提取数据 - 然后创建一个通用的方法来创建一个新的对象在你的数据库中的数据。