2009-11-13 46 views
0

有没有人提供设计ROLAP多维数据集时需要考虑的事项的列表,而不是MOLAP(我在Pentaho中做了这个,但我想这些原则并不适用 - 与其他实现类似)。例如,我在想的东西,如:多维数据集设计 - ROLAP注意事项与MOLAP

  1. 应该额外转型工作在ETL阶段进行查询多维数据集时,以减少计算工作?

  2. 我的所有维度表应该与我的多维数据集位于同一个数据库中吗?

回答

1

我是印度尼西亚的Pentaho实施者。首先,当然你应该尝试通过所涉及的代理键来汇总所有的度量组。

而在Mondrian中,您可以使用其他聚合表“缓存”一些计算。你可以在Pentaho Aggregate Designer中完成。但在此之后,您将需要在数据仓库/ ETL阶段进行额外的工作。

问候,

FERIS

http://pentaho-en.phi-integration.com

1

首先 - 设计是相似的,但它们是由不同的性能驱动的&可伸缩性策略。

其次 - etl过程几乎相同。除了 - 由于关系数据库中的可伸缩性特点,您通常会在rolap多维数据集中看到比molap多维数据集更多的数据。你经常会看到一个非rolap数据库(仓库,甚至是事务数据库)的内的rolap立方体,它不仅仅支持rolap。

最后,如果您有大量数据量,通常会生成聚合表。这种聚合可以通过很多不同的方式完成,但我认为它通常不由ETL过程驱动,除非您缺乏管理单独的异步过程的能力或者使数据卷不能运行期间摘要作业。

+0

+1感谢您的信息。我的ETL中的预聚合证明是必须的.​​.. – davek 2009-12-03 10:07:25

+0

在这种情况下 - 更多信息: 为此目的创建通用聚合器类非常容易。如果每小时运行ETL,则可以使用ETL在小时级别生成聚合。如果您将etl生成的每小时聚合进入暂存表并将结果合并到主表中,它将提供达到当前小时的聚合。然后,如果有必要,您还可以拥有一个单独的流程,以便将数据进一步滚动到日常级别。 – KenFar 2009-12-03 14:12:40