2010-03-18 60 views
1

我正在寻找想法来填充数据集市中的事实表。可以说我有以下尺寸关于在数据集市中填充事实表的想法

  1. 医师
  2. 患者
  3. 日期
  4. geo_location
  5. patient_demography
  6. 测试

我用了两个ETL工具来填充维度表 - Pentaho和Oracle Warehouse Builder。日期,患者人口统计和地理位置不会从运营商店获取数据。所有维度表都有自己的新代理键。

我现在想用患者访问的细节填充事实表。当患者在特定的日期访问医生时,他命令测试。这是事实表中的信息。还有其他一些措施,我简单地省略了。

我可以使用源系统的事实表中的所有必需列创建单个联接。但是,我需要存储患者,医师,测试等维度表中的密钥。实现此目的的最佳方法是什么?

ETL工具可以帮助吗?

谢谢 克里希纳

回答

5

每个维度表应该有一个唯一标识对象(人,日期,地点),一个表行描述的businessKey。在加载事实表的过程中,您必须根据BusinessKey从维度表中查找PrimaryKey。您可以选择直接查找维度表,或者在载入事实表之前为每个维度创建一个键查找表。

Pentaho Kettle具有用于此目的的“数据库值查找”(转换步骤)。您也可以查看Kimball的数据仓库ETL工具包的“交付事实表”部分。