apriori

    0热度

    2回答

    按照下面提供的FP树: 对于项目E: 条件模式基是: {B:1,A:1} {B:1 ,A:1,C:1} 从该条件FP-树被获得为 {B:2,A:2} 但如何获得从这个频繁模式?然后关闭频繁集和最大频繁集?

    0热度

    1回答

    我正在寻找一种像Apriori这样的算法,但是它的顺序如下。 我需要一个算法来找到最频繁的模式。 实施例: A B C dê A B C A C B d dË全称 最频繁模式:A B C 的顺序是非常重要的。一个C B不应被视为,因为A C B在我的例子中只有一次,但A B C是三次。 有没有算法,或者是我自己编码的最佳解决方案? 感谢您的帮助。

    1热度

    1回答

    我一直在使用arules程序包和apriori算法来为一组事务创建​​一些规则。现在我有了一些规则,我很好奇如何实现它们 - 无论是在R还是在SQL Server 2008 R2中。 有没有人有这样做的经验?看起来该包可以编写一个PMML文件,但我找不到如何将其转换为SQL的示例。该软件包还具有预测功能,但它似乎用于评分聚类。

    1热度

    1回答

    我想统计表中所有项目的频率。我的出发表是这样的: +------+------+ | Col1 | Col2 | +------+------+ | A | Z | | B | Y | | A | Y | +------+------+ 而且我希望得到以下结果: +------+-------+ | Item | Count | +------+-------+ | A |

    1热度

    2回答

    我想通过以下方式在R中运行apiriori算法产生的规则的子集。 规则子集必须具有只有其他列表(如项目)中的任何项目的LHS。 RHS没有限制。 我尝试下面的代码,但我无法得到预期的结果: > library(arules) > library(datasets) > data(Groceries) > rules <- apriori(Groceries, parameter = list

    1热度

    1回答

    我在R工作组,有一个数据集,它看起来像下面 [1, 2, 3, ""] [1, 2, "", 4] [1,"", "", ""] 我读这些值转换为交易对象,然后将它们传递到怡亨或先验频繁项目评估。当我的频繁项集看起来像下面的问题出现了: {1,""} {2,3,""} 我想,因为我认为它减慢处理,也不会使从预测的角度来看任何意义,从计算中删除这些行。你能帮忙吗?我的R代码如下。 tr

    2热度

    1回答

    我是R品牌的新手,请原谅任何看起来过于明显的事物。 我使用apriori来评估频繁项目集。当我执行下面的代码和我的子集调用返回项目时,一切都很好。问题是子集上没有任何返回(该条件不返回子集)。当它这样做时,我在尝试构建输出数据框时收到“object”rulesMatchLHS'not found“。在检查ifelse行上的rulesMatchLHS的有效性时,能否告诉我我做错了什么? rules

    1热度

    2回答

    我将比较两个阵列。 $db是第一个数组,$tr是第二个数组。将$tr与$db进行比较。如果的值在$db。然后$result包含$tr值: 所述第一阵列是$db $db = [ ['a','d'], ['a','e','f'], ['g'], ['b','e','d'], ['a','d','c','e'], ['d','g']

    0热度

    1回答

    我是新来的所有这些数据挖掘,WEKA工具等, 在我的学术项目,我必须处理错误报告。我有他们在我的SQL Server。我采用了Bug摘要属性和应用的标记化,停止删除词语和词干技术。 摘要中的所有词干单词都存储在数据库中;分离。现在我需要通过使用WEKA工具来应用频繁模式挖掘算法并找出频繁项目集。我有这样的arff文件。 @relation ItemSets @attribute bugid i

    0热度

    1回答

    我正在使用Apriori算法研究关联问题。尽管我得到的是输出结果,但是存在自相关或者说出自相关问题。车模应该与其他车模展现关系,但它展示了与同样的车模的关系。输入列有重复。我刚刚从大型数据集中输入了一大块输入。 有没有办法从输出中去除自相关问题。 的源代码提供如下: - mydata <- read.table(header=TRUE, text=" cookieid