我开始使用arulesSequences,目的是对我拥有的某些数据执行频繁序列挖掘。用于商店A中的数据看起来像下面:Apriori,arulesSequences,in R:它是否支持“篮子”的顺序(单一购物旅行中的顺序无关紧要)?
CUSTOMER_ID SEQ_NUM尺寸bought_items
1 17399 1 2 {100100}
2 17399 2 1 {800}
3 17399 3 2 {900900 }
4 17399 4 1 {405}
5 17399 5 4 {200505200505}
这意味着什么这个客户#17399多次与这家商店A一起购物。在他/她第一次购物时,此人购买了物品代码为100和100(2件物品)的物品。在他/她的第二次购物行程中,该顾客仅购买了物品800.以此类推。
现在我想用cSPADE这个客户,其中为了不事关一个“篮子”里,但整个购物之旅事情做。所以,最终我的客户17399的记录是:
CUSTOMER_ID bought_items
17399 {(100,100),800(900900),405(200505200505)}
其中{}包含完整的序列和()代表每次购物之旅。
我一般理解,这是一个possibility.However,我还没有看到任何实例(搜索了几个小时)或笔记明确地谈论arulesSequences支持这一点。有什么想法吗?将不胜感激的帮助。
谢谢你的时间。