2016-05-15 103 views
0

我使用Apriori算法来找到频繁的项目集。我使用最小支持作为2,我得到的输出如下,项目集有2个或更多的支持;Apriori算法的最终输出我们应该考虑什么

[3,5] [1,3] [2,5] [2,3] [2,3,5]

所有上述项目集具有比最小支持多个支持值。 但我很疑惑哪些项目集应该被视为这5个项集中的频繁项集,我也想知道我们作为Apriori算法的最终输出得到的结果,它只是一个最终集还是多于一个集不管大小的设置?

谢谢

+0

你的意思是“哪个项目组应该被视为”他们中最常见的“? –

+0

是的。我应该使用哪个项目集来最终为用户推荐项目? – user3785318

+0

你看过R的'arules'包吗?来自'apriori()'函数的规则可以用'confidence'来排序。如果我使用“Apriori”作为推荐人,我会选择具有类似“lhs”的规则,并从他们中挑选出具有最高“可信度”的“rhs”。你可以阅读关于R'实现'apriori'算法[here](http://rpubs.com/sbushmanov/180410) –

回答

0

您的结果不完整。它缺少所有频繁的1项目集。

此外,你应该保持频率。

你总是需要频繁的项目集,但是你经常需要从它们派生出关联规则

相关问题