2016-09-30 129 views
-2

所以我的问题是关于我面临的一个特殊问题,即我作为当前工作的一部分必须参与的领域之一。来自交易级别数据的帐户级别视图

该域名是信用卡交易。所以它在交易层面是独一无二的。但是一个人可能会进行多次交易。现在显然每笔交易都不会完全相同。

所以我有这个基本的特征数据集,我可以轻松管理。从这个数据集中,我想要评估各个细分市场的客户级别性能,这些数据应该很容易访问,而无需为不同的变量组合运行我的代码。基本上,我所瞄准的是以客户层面的观点来看,这不会导致信息在账户方面的任何损失,而且我仍然可以在各个细分市场的客户层面上查看性能。

你们有没有做过类似的分析?或者你有什么好的想法,应该怎么做?我不知道这个解释有多清晰,但是让我知道你是否需要进一步解释。谢谢你的帮助!

+0

你需要更具体。你有什么,你想要什么,你有什么尝试...... – DCR

+0

好吧,所以我有交易ID。哪些是独特的。反对每个交易ID将是账户ID。这将会重复。每个交易将由一组类别变量来定义。假设每笔交易都有变量A,B,C,D。我必须对这些变量的每个组合进行性能分析。帐户ID在每个组合中都是唯一的。假设问题是我必须总结我在A,B级的表现;和A,B和C级别。 我想在一个csv中查看这两个视图。目前我所想到的仅仅是一个proc摘要并且切换_TYPE_变量。 –

+0

如果您想要帮助,可以让人们轻松地帮助您。用你所拥有的东西发布你的一小部分数据库样本,然后尝试发布你想要的模型 – DCR

回答

0

假设您有来自10位客户的30笔交易的数据(每笔交易三笔交易)。在关系型数据库中(通常在SAS中也是一个好主意),您通常会拥有一个事务表(具有列transactionID,customerID,transactionDate,transactionAmount)和一个客户表(具有customerID,customerName,customerSegment等列) 。这是数据库正常化的一部分。您将交易级数据与客户级数据分开。

如果您是PROC SQL的粉丝,那么在SAS中,该设置对您将会很有帮助。如果你想分析某个customerSegment的事务,你只需加入表(或子查询或其他)。

SAS中的另一种选择是通过customerID合并两个表,创建一个数据集,每个事务有一个记录,并且有一些变量是事务属性,其他变量是客户属性。所以可能看起来像:

custID transID transDate transAmount customerSegment customerDOB 
1  1  1/1/2015 100   A    1/1/1990 
1  2  1/2/2015 50   A    1/1/1990 
1  3  1/3/2015 75   A    1/1/1990 
2  4  1/1/2015 10   B    12/12/1950 
2  5  1/2/2015 5   B    12/12/1950 
2  6  1/3/2015 75   B    12/12/1950 

也就是说高效的存储少(少标准化),因为重复来自同一个客户的每一笔交易的客户属性的值。但是,当您想要通过客户属性分析交易数据时,它可以使生活更轻松。

欲了解更多关于此,谷歌数据库规范化。 Toby Dunn在SAS中有一些关于标准化的很好的论文,例如, http://analytics.ncsu.edu/sesug/2007/TU03.pdf