2010-10-12 58 views
3

我正在为邮件/电子邮件/短信联系信息和历史记录构建SQL Server DataMart的计划阶段。每条数据都位于不同的外部系统中。因此,电子邮件地址没有帐号,短信电话号码没有电子邮件地址等。换句话说,没有共享主键。有些数据有重叠,但除了重复出现时保留最完整的版本,我可以做的不多。从多个外部系统构建DataMart的最佳方式?

用这些数据构建DataMart是否有最佳做法?为每个外部密钥创建一个具有列的密钥表是否可以接受?然后,可以分配唯一的主ID以将其绑定到其他DataMart表。

寻找关于我可能还没有想到的方法的想法/建议。

谢谢。

回答

2

电子邮件地址或电话号码本身听起来像是一个合适的业务密钥。通常使用“分段”数据库从多个来源加载数据,然后分配代理键并执行其他转换。

您是否熟悉数据仓库方法和设计模式?如果您没有以前的知识或经验,请考虑聘请一些帮助。商业智能/数据仓库项目的失败率非常高,错误可能很昂贵。

+0

啊,代孕钥匙可能是我所追求的。谢谢。我回顾了星型模式,ETL过程,多维数据集等。我当然非常感谢这些建议。由于项目在初期的测试环境规模较小,我认为现在聘请外部帮助是不值得的。我们已经有现场工作人员,我们可能会通过这一概念完成一次。我们现在正处于计划阶段。 – MattB 2010-10-14 15:36:43

0

好吧,没有其他信息将不同的零件捆绑在一起,您的数据集市将非常简陋。您可以获取各种类型的数据(短信,电子邮件,邮件),各种类型的指标(“本周/月/季度/年,我们平均每天发送42.5短信,每月发送8000封邮件!w00t !“)。只有电话号码和电子邮件地址,您的“其他数据集”可能必须是电话公司名称或互联网域名。我想你可以将它链接到某种地理信息(互联网提供商位置?),或者可能是公司的财务信息。如果你还不知道你想要走哪个方向,那就模糊一些。老实说,这听起来像是一个高层人士对于“数据智能”流行词的一个下跪反应,再加上听到有关通信指标的重要性的事情,所以他们发送了下来的订单链“得到我们可以使用一些数据集来运行我们所有电子邮件的统计信息!“

您需要弄清楚您或您的雇主期望从这个项目中获得什么,然后然后会计算出您当前收集的数据是否可以让您跟踪该信息。现在听起来好像你在倒退(“我有这些数据,有什么好处?”)。完全有可能你目前没有你需要的数据,这意味着你需要购买它(谁知道你是否可以)或者开始收集数据,在这种情况下,你不会有漂亮的图表和趋势 - 为上层管理线看一段时间...落下右符合警告dportas给你在他的第二个段落;)

+0

我们的目标是让联系信息,联系历史记录和行为更容易在中央位置访问,而不是使用混杂在一起的Excel电子表格与多个系统的数据一起使用。我们目前无法轻松跟踪联系历史记录。因此,我们希望将这些数据集中在一个更容易被所有人访问的中心环境中。问题在于数据分散且不易访问。这就是我们希望改变的。它规模较小,最初只能由3人使用。 – MattB 2010-10-14 15:27:03

+0

尽可能简化您的数据收集。传入的电子邮件应该位于某个电子邮件服务器上,因此您应该能够从中取出信息。电话可能记录在PBX系统中,如果是数字系统,则应该能够从中获取信息。短信...不知道你如何记录这些信息,除非你有一个系统坐在两个人之间发短信。如果你这样做,它应该有信息,你可以撤出。所有这三种情况都需要有人知道如何进入每个系统的数据,并找出如何将它送到数据集市。 – 2010-10-14 20:52:11

+0

每个系统都可能存储大量的信息历史记录,或者只有一个月的价值,除非您知道系统,否则无法知道。所以假设它没有存储一个永不停息的日志,你必须找出一个时间表来定期从每个系统中获取数据。然后,您必须为提取的数据进行适当的数据集市设计,以便生成您要查找的指标。顺便说一句如果你现在不记录联系历史记录,那么你正在讨论在你的用户面前推出一个新的应用程序,诀窍是让他们正确地使用它。 “恶魔在细节中” – 2010-10-14 21:02:01

相关问题