我想用Apriori来对交易数据进行亲和度分析。我有一张带有订单和他们信息列表的表格。我主要是需要用OrderID和产品ID属性,其是在以下格式Weka Apriori算法
订单ID的ProductID
1的
1乙
图1C
2甲
2 C
3甲
Weka要求您为每个产品ID创建一个名义属性,并使用如下所示的true或false值指定项目是否存在于订单中:
1,TRUE,TRUE,TRUE
2,TRUE,FALSE,TRUE
3,TRUE,FALSE,FALSE
我的数据集包含约10K记录... 3K左右不同的产品。任何人都可以建议一种方法来创建这种格式的数据集? (除了手动耗时的方式...)
嗯,我是一个刚刚开始尝试这些东西的学生,所以它看起来不像是一个“简单的编程任务”可能还有其他很多其他人,因为我看起来非常类似的未解答的问题。那谢谢啦。 – user2275504 2013-05-16 09:09:03
是的,这里有很多题外话题。该网站是编程问题,你显然还没有尝试用自己的简单代码解决这个问题。 – 2013-05-16 17:00:08