2016-04-28 50 views
1

我有一个数据集,其中包含来自客户的访问历史记录。学习如何预测未来客户的历史行为

它有三列数据集,包括客户ID,AM/PM(AM或PM访问)和Weekday/Weekend(工作日或周末访问)。

我想从这个数据集中学习,并选择在指定输入(如AM/Weekday)中访问次数最多的前50位客户。现在,我使用一类SVM(我只有积极(访问)数据)为每个客户创建模型。由于一类SVM只有二进制输出,因此我只能告诉某个客户将访问或不输入指定的输入,而不是选择前50名客户。

我想知道是否有一个算法,可以从一个积极的唯一数据集中学习,并给出得分或概率,如输出?

+1

这是一个足以Data Science Stack Exchange(http://datascience.stackexchange.com/)的问题。你可能会在那里得到更多的专业意见你也可以看看这个:https://pkghosh.wordpress.com/2015/07/06/customer-conversion-prediction-with-markov-chain-classifier/ – armatita

回答

0

这是机器学习中的一个子类别问题。您可以从这份调查中学到很多东西:“一级分类: 技术的研究和回顾分类法”(http://arxiv.org/pdf/1312.0049.pdf)。希望能帮助到你。