2010-02-02 113 views
1

我正在开发一个数据仓库,作为我公司企业应用程序套件的一部分。所以我一直在学习很多关于DW概念的知识,但规则引擎似乎很难,我也找不到有关各种实现方式的很多信息。规则的重点是验证数据质量,并在达到某些业务指标时发出警报(例如,本月的销售额为$ xx.xx)如何在数据仓库中实施数据质量和验证规则?

我们的应用程序需要为每个客户端进行定制,所以我想要使规则具有通用性。有什么方法可以实现规则引擎?

  1. 现成的工具? (我会被重新分配所以这通常不能很好地工作)
  2. 框架/ API的
  3. 设计Paterns创造我们自己的
  4. 其他想法

感谢。

回答

2

这可能有助于将这看作是有几个独立的系统一起工作 - 而不是一个“大引擎”负责任何事情。

说到“商业指标”,请看KPIs(关键绩效指标)。分析引擎(MS-SSAS,Pentaho-Mondrian等)允许简单定义和呈现(仪表板)KPI。如果开发你自己的,你可能仍然会理解这个概念。

数据质量主要是“运营系统”的责任,这就是收集数据的地方。如果垃圾达到DW,则为时已晚。使用data profiling tools可以了解源数据的外观 - 数据质量必须在源处执行。

在DW加载过程中,您可以使用ECCD(Extract,Clean,Conform,Deliver)分步实施某些“数据标准”的方法。 ETL工具(MS-SSISPentaho-KettleOracle Data Itegrator,等..),旨在帮助与此有关。

关于规则引擎,看inruleILOGFicoCorticonJboss Drools,等等,这些都是 “独立系统”,当与策划可用于执行业务规则操作系统。执行业务规则通常会导致数据质量提高。您可以下载Drools并快速开始修补,其他供应商也允许免费下载。