所以我的问题是关于我面临的一个特殊问题,即我作为当前工作的一部分必须参与的领域之一。来自交易级别数据的帐户级别视图
该域名是信用卡交易。所以它在交易层面是独一无二的。但是一个人可能会进行多次交易。现在显然每笔交易都不会完全相同。
所以我有这个基本的特征数据集,我可以轻松管理。从这个数据集中,我想要评估各个细分市场的客户级别性能,这些数据应该很容易访问,而无需为不同的变量组合运行我的代码。基本上,我所瞄准的是以客户层面的观点来看,这不会导致信息在账户方面的任何损失,而且我仍然可以在各个细分市场的客户层面上查看性能。
你们有没有做过类似的分析?或者你有什么好的想法,应该怎么做?我不知道这个解释有多清晰,但是让我知道你是否需要进一步解释。谢谢你的帮助!
你需要更具体。你有什么,你想要什么,你有什么尝试...... – DCR
好吧,所以我有交易ID。哪些是独特的。反对每个交易ID将是账户ID。这将会重复。每个交易将由一组类别变量来定义。假设每笔交易都有变量A,B,C,D。我必须对这些变量的每个组合进行性能分析。帐户ID在每个组合中都是唯一的。假设问题是我必须总结我在A,B级的表现;和A,B和C级别。 我想在一个csv中查看这两个视图。目前我所想到的仅仅是一个proc摘要并且切换_TYPE_变量。 –
如果您想要帮助,可以让人们轻松地帮助您。用你所拥有的东西发布你的一小部分数据库样本,然后尝试发布你想要的模型 – DCR