apriori

    0热度

    1回答

    我想返回具有任何数字或包含特定字符串(如“.part”)的RHS规则。当我运行下面的代码时,出现错误。 有关如何让RHS返回包含指定字符串或任何数字的所有项目的任何想法? library("arules") basket_rules <- apriori(ttk, parameter = list(sup = 0.0008, conf = 0.10, target="rules"), appe

    0热度

    2回答

    我有一个数据帧df像下面删除列标签: df <- data.frame(V1 = c("Prod1", "Prod2", "Prod3"), V2 = c("Prod3", "Prod1", "Prod2"), V3 = c("Prod2", "Prod1", "Prod3"), City = c("City1", "City2", "City3")

    0热度

    1回答

    我试图让R apriori算法允许我在lhs中同时指定多个属性。 rules <- apriori(Data, parameter=list(supp = 0.0001, conf = 0.001, minlen = 2), appearance = list(lhs = c("DiagnoseTekst=Acuut hartfalen"), default="rhs")) 上面一行将筛选只是

    0热度

    1回答

    我目前正试图从我通过c#中的支持算法获得的频繁项目集中找到一个强大的关联规则。对不起,我现在还没有任何有价值的代码,但任何东西都会受到欢迎。有关更多解释,请参阅页面底部的表格。我希望得到关于如何基于置信度生成最终频繁项目集的任何提示。 https://www.codeproject.com/Articles/70371/Apriori-Algorithm

    1热度

    1回答

    我有一个问题需要搜索组合的频率的正确解决方案。 此我的代码: import pandas as pd import itertools list = [1,20,1,50] combinations = [] for i in itertools.combinations(list ,2): combinations .append(i) data = pd.DataFr

    1热度

    1回答

    尽管head()可用于提取前n个规则,但某些RHS项目可能会多次出现。我希望找到前n个独特的RHS项目以及每个这样的项目的最高规则。 我已经编写了完成此操作的代码,但运行速度非常慢,大概是由于使用了'subset'函数,效率非常低。我的代码遍历RHS的独特项目,找到与它相关的规则的子集,并返回项目的单个顶部规则。这是一种有效的方法吗?有没有更好的办法? library(arules) data(

    0热度

    1回答

    我在我的数据上实现了Aprioiri算法。数据近700条记录,近81个属性。我想为这些数据生成关联规则。 这是我的程序代码: public class Aprioritest { /** * @param args the command line arguments */ public static void main(String[] args) throws Exception {

    0热度

    1回答

    enter image description here任何人都可以帮助建议如何将以下数据合成到一个'Arules'可以使用。 命名为 'DF' 数据集是类似 'Recieptnumber', '产品名称' 1,鸡蛋 1,苹果 2,水 3,芯片 3,苹果 3,纸 ..... 正在使用表(df)函数来创建矩阵---想法是备用矩阵。但它不能用于'Arules'包 任何建议如何传输数据集? 谢谢!

    0热度

    2回答

    请帮助将购物项目的字符向量转换为arules的“交易”。原始数据是这样的: shopping_items <- c("apple banana", "orange", "tea orange beef") 向量的每一个元素代表在单个事务中购买的物品,并且所述物品通过的空间“”是分开的,例如事务1包括两个项,其是苹果,香蕉。我怎样才能将它转换成“交易”类型,以便我可以在arules中使用它? 预

    0热度

    1回答

    处理apriory算法并尝试将rules对象转换为dataframe,如下所示。它运作良好,数据已被存储在datafarme ruledf=inspect(sort(rules, by = 'lift')[1:100]) 但是,当我改变代码来存储数据帧多观察(1000),那么它失败了。 ruledf=inspect(sort(rules, by = 'lift')[1:1000]) summ