我需要存储大量的小数据对象(每月数百万行)。一旦他们得救,他们就不会改变。我需要:免费数据仓库 - Infobright,Hadoop/Hive还是什么?
- 将它们存储安全
- 用它们来分析(主要是面向时间)
- 检索某些原始数据偶尔
- 这将是很好,如果可以用的JasperReports或BIRT使用
我的第一个镜头是Infobright的社区 - 只是一个立柱导向,只读存储机制对MySQL
另一方面,人们说NoSQL方法可能会更好。 Hadoop + Hive看上去很不错,但文档看起来很差,版本号小于1.0。
我听说Hypertable的,Pentaho的,MongoDB的....
你有什么建议?
(是的,我在这里找到了一些话题,但它是一年或两年以前)
编辑: 其他解决方案:MonetDB,InfiniDB,LucidDB - 你有什么感想?
版本号并不重要。 HDFS/Hadoop工作得很好 - 但如果您有多个节点进行数据和分析,它们只会很有趣。 – Leonidas 2010-03-11 09:11:02
如果你想快速入门,我建议使用pentaho和数据库pentaho支持。我认为下面的答案更侧重于数据访问,但在数据仓库开发中,工具也很重要。 – elprup 2012-08-15 06:57:37
@Piotr:这是一个两岁的问题,没有答案。我需要一个与您的规格几乎相同的解决方案。最后你决定使用什么? – 2013-02-19 10:09:30