2017-04-22 139 views
0

在我的教材中,它说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间依赖的,但根据数据仓库的四个特点,非易失性属性表示一次数据已在数据仓库内输入,不能随意更改。数据仓库为何与时间有关?

那么有没有数据仓库的其他任何涉及数据仓库时间依赖的属性?

回答

0

你的课本是否说“时间依赖”或“时间变量”?这可能与Bill Inmon的定义相一致,即数据仓库是面向主题的,集成的,时间变量和非易失性的。

“时间变量”表示数据仓库完全包含在一段时间内。另一种说明的方式是,数据仓库在一段时间内是一致的,这意味着数据仓库每天,每小时或以其他定期的方式加载,并且在此期间不会更改。

请记住,这些要求是在1992年编写的,但是在实时数据仓库成为现实并且数据仓库每秒可能会多次更改时,它们在25年后有点难以支持。

另外,请注意“非易失性”的定义。有些人认为数据永远不会改变,但这又是一个过时的概念。显示订单预测出货日期的累计快照事实表可能会在订单生命周期内多次更新。当然,这取决于事实的目的 - 如果要衡量预测日期的波动性,我们会保留每一个变化,但如果要衡量订单在其生命周期中的流动,我们只需更新它。

就个人而言,我更喜欢Ralph Kimball的定义:“数据仓库是专门为查询和分析而构建的交易数据的副本。”更清楚,重要。