rapidminer

    1热度

    1回答

    有人可以解释我最熟悉的datamining开源工具的主要优点和缺点吗? 无处不在,我读了RapidMiner,Weka的,橙,KNIME都是最佳的。 look at this blog post 有人可以在一个小的项目符号列表中做快速的技术比较。 我需要有以下几种: 应该支持分类算法(朴素贝叶斯,SVM,C4.5, KNN)。 它应该很容易在Java中实现。 它应该有可以理解的文档。 它应该有参考

    0热度

    1回答

    我已经在数据集上实现了k-means聚类。我试图通过查看快速采矿者给出的平行和偏差图来分析聚类k。 其目的是分析簇的均匀性。在给定的各种性能模型中,运算符“簇距离性能”运算符用于k均值聚类的结果。 是否有其他运营商可以提供此类分析? 我拥有的数据集具有较大的数值向量(在 数百和数千),我也有一个数据集,其极小值(小数点后5至8位)极其小。 我不知道如何解释,我从运营商“群集距离性能”得到的结果如下

    0热度

    3回答

    我现在正在使用RapidMiner,并试图将我在xlsx文件中的RapidMiner结果复制到txt文件中,以便使用python进行一些进一步处理。我在A列(A1-A1500)中显示纯文本,C列(C1-C1500)中显示相应的文件名。 现在我的问题: 是否有任何可能(我正在考虑xlrd模块)读取A列中每个单元格的内容并将其打印到新创建的txt文件中,并在相应的列C中给出文件名? 正如我有点此刻失去

    0热度

    1回答

    假设我需要建立高精度,低回忆的分类器。我应该在RapidMiner中使用哪个操作员?例如,ApplyModel运算符不支持阈值中的任何干预?目前还不清楚同一个ApplyModel操作符如何与不同建模模型一起工作:NeuralNetworks,SVN等。

    0热度

    1回答

    如何使用RapidMiner在测试数据上运行分类器,并根据该数据对用户进行分类 - 我需要它来实际输出谁分类用户是,而不是它的表现。任何帮助将不胜感激。

    0热度

    1回答

    我想知道如何为我的属性在快速矿工中定义序数据类型? 例如我有血压属性有三个值(高,正常,低)或具有高值和正常值的胆固醇以及其他一些属性。我应该为这些属性设置整数数据类型吗?

    0热度

    1回答

    我有两个数据集在Excel中,我想加入但有一个重大转折。这里是我的数据看起来像: 请注意两件事: 1的ID 3在Sheet1中的手机比在Sheet2的不同; 2-对于ID 4,在sheet2中有电话号码,但没有在sheet1中 我想要的是这两张纸的组合,它们将包含所有信息。因此,缺少的值将被填充,并且每当有相同ID的2个不同值时,我想让rapidminer创建一个包含其他值的附加列(例如:phon

    1热度

    1回答

    我想连接到一个来自Rapidminer的mysql数据库,我不确定,但要访问数据库,我必须首先在我的mySQL机器上执行GRANT ALL字符串,是吗? 它会像这样: GRANT ALL ON 。给用户@ IPADRESS IDENTIFIED BY'password'; 其中IPADRESS应该是我的远程计算机的ipadress,密码是mySQL Workbench的根登录密码,是正确的吗? 但

    -2热度

    3回答

    我有一个数据集,其中以某种方式将下一个单数的数据是在对于一行中的先前的数据的顶部加入,而每列的,这意味着, 行与ID 1是原始纯数据,但例如ID行10已将前9个数据集中的数据添加到其自身中... 我现在想要的是为每个不同的项目获取原始纯数据,这意味着对于每个ID,如何从所有数据中减去所有数据ID,10?我将不得不这些。减去前一个,对ID 9等等... 我想做到这一点无论在SQL Server或Ra

    1热度

    1回答

    我希望有人能为我解答这个问题,因为我被困住了。 rapidminer在相关矩阵中使用什么方法?对于所有的数据组合都不错,但对于名义/分类数据集最重要? 我正在使用rapidminer建立一个相关矩阵,并小心地将所有属性标记为数字,二项式,多项式等等。我发现我的矩阵显示了一些名义/名义属性组合的负相关,因为基于我通常会选择的方法(Phi,Cramer's V,应急系数)来计算这一点,所以这并没有做出