apriori

0热度

2回答

按照下面提供的FP树：对于项目E：条件模式基是： {B：1，A：1} {B：1 ，A：1，C：1} 从该条件FP-树被获得为 {B：2，A：2} 但如何获得从这个频繁模式？然后关闭频繁集和最大频繁集？

0热度

1回答

我正在寻找一种像Apriori这样的算法，但是它的顺序如下。我需要一个算法来找到最频繁的模式。实施例： A B C dê A B C A C B d dË全称最频繁模式：A B C 的顺序是非常重要的。一个C B不应被视为，因为A C B在我的例子中只有一次，但A B C是三次。有没有算法，或者是我自己编码的最佳解决方案？感谢您的帮助。

1热度

1回答

R arules/apriori - 如何实际执行

我一直在使用arules程序包和apriori算法来为一组事务创建一些规则。现在我有了一些规则，我很好奇如何实现它们 - 无论是在R还是在SQL Server 2008 R2中。有没有人有这样做的经验？看起来该包可以编写一个PMML文件，但我找不到如何将其转换为SQL的示例。该软件包还具有预测功能，但它似乎用于评分聚类。

1热度

1回答

使用SQL的表中的项目数

我想统计表中所有项目的频率。我的出发表是这样的： +------+------+ | Col1 | Col2 | +------+------+ | A | Z | | B | Y | | A | Y | +------+------+ 而且我希望得到以下结果： +------+-------+ | Item | Count | +------+-------+ | A |

1热度

2回答

R子集arules由lhs

我想通过以下方式在R中运行apiriori算法产生的规则的子集。规则子集必须具有只有其他列表（如项目）中的任何项目的LHS。 RHS没有限制。我尝试下面的代码，但我无法得到预期的结果： > library(arules) > library(datasets) > data(Groceries) > rules <- apriori(Groceries, parameter = list

1热度

1回答

删除空值行时评估怡亨和先验项集

我在R工作组，有一个数据集，它看起来像下面 [1, 2, 3, ""] [1, 2, "", 4] [1,"", "", ""] 我读这些值转换为交易对象，然后将它们传递到怡亨或先验频繁项目评估。当我的频繁项集看起来像下面的问题出现了： {1,""} {2,3,""} 我想，因为我认为它减慢处理，也不会使从预测的角度来看任何意义，从计算中删除这些行。你能帮忙吗？我的R代码如下。 tr

2热度

1回答

检查R中是否存在物体

我是R品牌的新手，请原谅任何看起来过于明显的事物。我使用apriori来评估频繁项目集。当我执行下面的代码和我的子集调用返回项目时，一切都很好。问题是子集上没有任何返回（该条件不返回子集）。当它这样做时，我在尝试构建输出数据框时收到“object”rulesMatchLHS'not found“。在检查ifelse行上的rulesMatchLHS的有效性时，能否告诉我我做错了什么？ rules

1热度

2回答

PHP比较或搜索两个不同阵列的阵列

我将比较两个阵列。 $db是第一个数组，$tr是第二个数组。将$tr与$db进行比较。如果的值在$db。然后$result包含$tr值：所述第一阵列是$db $db = [ ['a','d'], ['a','e','f'], ['g'], ['b','e','d'], ['a','d','c','e'], ['d','g']

0热度

1回答

先验在WEKA

我是新来的所有这些数据挖掘，WEKA工具等，在我的学术项目，我必须处理错误报告。我有他们在我的SQL Server。我采用了Bug摘要属性和应用的标记化，停止删除词语和词干技术。摘要中的所有词干单词都存储在数据库中;分离。现在我需要通过使用WEKA工具来应用频繁模式挖掘算法并找出频繁项目集。我有这样的arff文件。 @relation ItemSets @attribute bugid i

0热度

1回答

R编程。 apriori算法中的自动关联

我正在使用Apriori算法研究关联问题。尽管我得到的是输出结果，但是存在自相关或者说出自相关问题。车模应该与其他车模展现关系，但它展示了与同样的车模的关系。输入列有重复。我刚刚从大型数据集中输入了一大块输入。有没有办法从输出中去除自相关问题。的源代码提供如下： - mydata <- read.table(header=TRUE, text=" cookieid