我在R工作组,有一个数据集,它看起来像下面删除空值行时评估怡亨和先验项集
[1, 2, 3, ""]
[1, 2, "", 4]
[1,"", "", ""]
我读这些值转换为交易对象,然后将它们传递到怡亨或先验频繁项目评估。当我的频繁项集看起来像下面的问题出现了:
{1,""}
{2,3,""}
我想,因为我认为它减慢处理,也不会使从预测的角度来看任何意义,从计算中删除这些行。你能帮忙吗?我的R代码如下。
tr <- read.transactions("Items.csv", rm.duplicates=TRUE, format="basket",sep=",")
dataset1 <- as.vector(t(dataset1))
frequentItems <- eclat (tr, parameter = list(supp = 0.03, minlen=2, maxlen = 4))
inspect(frequentItems)
谢谢, 马特
数据集的结构看起来很令R人感到困惑。你可以给我们提供一些我们可以自己尝试的代码,也许可以添加你的函数来的包(这是'arules'包,对不对?) –