2008-11-19 85 views
2

我正在开发一个Rails应用程序,它将访问大量的RSS提要或抓取数据(主要是新闻)的网站。这将是Google新闻之类的东西,但采用不同的方法,因此我将存储大量新闻(或新闻摘要),按不同类别对其进行分类,并使用排名和推荐技术。哪个是Rails应用程序的最佳数据库?

  • 我应该用MySQL吗?

  • 是否值得使用IBM DB2 purexml来存储doucuments? 也不需要如果我选择DB2,Ruby搜索实现 (Ferret,Ultrasphinx和其他) 。那是对的吗?

  • PostreSQL在这方面有什么优势?

  • 在这种情况下使用Couch DB在 中有意义吗?

我想选择最佳选项,但不会使解决方案过于复杂。所以我放弃了使用两种不同存储解决方案的想法(一种用于新闻文档,其他数据用于其他数据)。我也只考虑“免费”选项,所以我没有看Oracle或MS SQL Server。

在此先感谢。

回答

3

purexml比SQL更重,所以您为webserver和数据库之间的往返支付更多。如果你打算有很多用户,我会避免它,你最好让你的Web服务器缓存请求,从而避免每次都创建xml(rss),如果这是你正在考虑的。

我会用MySQL,因为它真的很擅长服务,它的完全免费,很好的PostgreSQL也是如此,但没有使用它,所以我不能说。

CouchDB可能是有意义的,但是如果您计划对数据进行OLAP(脱机分析),那么正常的RDBMS会更好。

+0

我上次查看的时候,OLAP是在线分析处理的缩写 – 2008-11-19 15:23:53

1

MySQL可能是最好的选择之一;轻便,易于安装和维护,多平台和免费。最重要的是,有一些很好的免费客户端工具。

需要思考的东西;由于系统的性质,您可能会有一些表格会非常快速地增长,因此您可能需要考虑性能。

因此,MySQL支持垂直分区,但只支持V 5.1。记住这一点。

干杯,

雅各布。

0

这听起来对我来说,你将构建的应用程序可以很容易地成为一个大型的网络应用程序。我建议PostgreSQL,因为它的可靠性而闻名。

您可以查看以下链接 - MochiMedia的Bob Ippolito告诉我们为什么他们放弃了MySQL for PostgreSQL。虽然帖子已经超过3年了,但MySQL 5.1最近的问题往往证明它们仍然相关。

http://bob.pythonmac.org/archives/category/sql/mysql/

0

MySQL擅长生产。我还没有使用PostgreSQL for rails,但它也是一个很好的解决方案。

在开发和测试环境中,我会从SQLite开始(默认),并且可能会在测试环境中迁移到目标数据库,因为您接近完成。

相关问题