2013-04-23 56 views
0

我是使用SSIS软件包的新手,对将数据从登陆到登台时找到增量的最佳实践感到困惑。需求是从统一数据存储(CDS)创建几个报表,从资源流向Landing到Staging到CDS作为ETL包,最后是从CDS构建报表。找到三角洲的最佳做法是什么?

我已经成功创建了包来将数据从源移动到着陆,因为它们非常简单。将数据从Landing移动到Staging有点令人困惑,因为修改的日期不够,因为上次ETL运行的2个更改可能会将数据返回到上一个日期的数据,这意味着自上次ETL运行以来没有更改。例如,值从A更改为B,然后返回A - 表示数据已返回到原始状态,但modifiedOn列已更改。

那么,是否应将来自Landing的所有列与连续分段中的现有列进行比较,或仅比较与提交报告相关的列?还是有另一种方法来找到三角洲?

请让我知道如果这不清楚或需要更多的细节。

+0

请您详细说明一个例子。我想我可以帮你解决问题 – CodeNinja 2013-04-23 21:44:21

回答

1

这是您业务的问题。我们希望他们能够在我们的需求文档中定义被认为是三角洲的东西。对于一些人来说,这只是少数几个领域,对于其他人来说则是一切。这取决于业务需求。我会把这个问题发给谁给了你开始的要求。如果你对自己的业务感到满意,那么你可以在inteh电子邮件中提供一个建议,说明你认为三角洲会是什么样的,大多数时候他们不会自己想出来并接受你的建议。但只有在真正了解与数据相关的正常业务需求时才这样做。您还可以为他们提供各种可能性的专业和服务,以帮助他们做出决定。

0

为什么你想要得到确切的三角洲?我的意思是,为什么你不希望已经提交给CDS的那一行,如果没有发生真正的变化,将会重新提交?如果您没有商业上的理由(报告需要)来做到这一点,那么听起来您会在不需要的地方增加复杂性。无论如何,如果你真的需要这个,我建议计算有趣的列的CHECKSUM,并检查你的新行的校验和与旧行的校验和。这blog应该可以帮助您了解如何使用校验和。

相关问题