2013-03-01 48 views
0

我们有一个包含客户对产品的映射数据集的列表,他买这样预测销售的项目,给予项目

c1->{P1, P2, p5} 
c2->{P3, P5, p4} 
c3->{P5, P2, p3} 
.... 

在此基础上,我们需要推荐产品,为客户,

对于cx客户,我们需要推荐该产品,因为我们拥有cx从上述集合中购买的数据,并且我们运行apriori来计算出建议,但对于大数据集却非常缓慢?

有人可以给我们一些建议,我们可以通过它来解决这个问题?

+0

我不完全理解你的训练数据是什么。你可以点亮一下吗?如果您有一段时间内“类似”商家的所有销售清单,并且需要查找人们一起购买的商品,请尝试通过Google搜索“频繁商品集挖掘”或“市场购物篮分析”。 – 2013-03-01 17:50:47

回答

0

我假设商家销售的商品是您的培训数据,然后随机产品是您的测试数据。所以最可能出售的商品将取决于商家目前销售的商品的“特征”。 “特征”是指物品的价格,类别,这些是你将要获得的细节。然后为了确定算法,我建议你看看特征空间。如果有小群集,那么即使最近邻搜索也会更好。如果分布比较复杂,则可以使用SVM。有各种数据可视化技术。以PCA和前两个维度进行可视化可能是一个不错的选择。

相关问题