我想比较使用Hadoop和HBase的系统设置,并使用Oracle DB作为后端实现相同。我对甲骨文方面的知识缺乏认识,所以要进行公平比较。Oracle安装需要重负载
工作负载和非功能性要求是大致这样的:与一个简单的关系和多个(非文本)在4小时内的索引的两个表
A)12M交易。这相当于每秒833笔交易(TPS),持续。这需要每8小时完成一次。
B)确保所有的写入都是持久的(因此在集群设置的情况下,正在运行的事务可以保持机器故障),并且具有可观的可用性级别?有了可观的可用性水平,我的意思是像磁盘和单个网络接口/ TCP连接丢失等常规故障不需要人为干预。罕见的故障,可能需要干预,但应通过发射一个可快速接管的冷备用来解决。
C)另外再添加300个TPS,但是在很多表格中几乎连续24/7发生这些事情(但是所有成对的两个具有相同的简单关系和多个索引)?
某些情况下:此工作负载为24/7,系统需要保存10年的实时查询历史数据。查询性能可能比亚秒级差一些,但必须足够活跃才能考虑日常使用情况。 ETL作业的设置方式使得流水少。同样在关系设置中,这个工作负载会导致很少的锁争用。我希望索引更新是主要的痛苦。为了尽可能公平地进行比较,我预计Oracle会提供最松散的一致性级别。
我无意抨击Oracle。我认为这是一个很好用的数据库。我试图得到一种平衡开源(和NoSQL)之间的感觉,就像我们做的一样,并且使用商业支持的,经过验证的设置。
你应该在更多的数据库特定的网站,如http://dba.stackexchange.com/或http://forums.oracle.com/forums/category.jspa?categoryID=18 – softveda 2011-01-19 11:10:04
问这个问题有道理。我已经做了。 – FvV 2011-01-19 11:31:23