rapidminer

    0热度

    2回答

    我是RapidMiner的新手...我在做的是我有一个使用ProcessDocuments运算符(子任务) - > Tokenize ...进行标记的10个文档的列表...结果是一个10乘800具有10行(每个文档一个)和800个属性(每个令牌一个)的示例集。 现在我想filterbylength 800个令牌,我再次使用ProcessDocuments运营商(子任务) - > FilterByL

    -1热度

    2回答

    在快速矿工中,我试图从xml页面使用xpath获取数据,我尝试了一些不同的语句,但没有成功。下面是即时通讯尝试检索的数据,我想要从无序列表中获取所有功能。 enter code here <div id="features"> <h3>Features:</h3> <ul><li>Front garden</li> <li>Rear Large Shed</li> <li>Superb

    2热度

    1回答

    我正在做阿拉伯语言的情感分析,我想创建自己的语料库,要做到这一点,我从Facebook收集了300个状态,并将它们分类为正面和负面,现在我想做这些状态的标记化,以获得单词列表,并且生成unigrams和bigrams,trigrams并使用跨折叠验证,我现在使用的是nltk python,这个软件能够完成这个任务fr阿拉伯语言或雷帕Minner会更好地工作,你怎么看,我想知道如何生成bigrams

    1热度

    3回答

    我想实时提取推文,我使用RapidmMiner进行情感分析,为了收集数据,我更愿意使用工具从twitter中自动提取它们,我认为groovy与使用weka的json可以完成这个任务,但是我没有找到一个tuto来完成这个任务,还有其他简单的工具吗?

    1热度

    1回答

    iam新增了rapidminer,我知道如何添加神经网络和aply模型以及如何使用交叉验证。但现在我想使用堆叠模块,但我得到的错误是我的神经网络不能与二项字段一起工作,但是在我开始使用堆栈模块之前它已经完成了。 在我的堆栈模块在左边我有2个adaboosts在第一个神经网络和第二个天真的byas。在右边部分我有一个singel神经网络,它给出了错误,我该如何解决这个问题?我已经看过这些问题,但是我

    1热度

    1回答

    我正在尝试创建一个带有训练数据集的模型,并且希望在测试数据集中标记记录。 我在网上找到的所有教程或帮助都只提供了使用交叉验证和一个数据集(即训练数据集)的信息。我找不到如何使用测试数据。我试图将结果模型应用于测试集。但测试集似乎给出了不同的答案。属性比预处理后的训练集大。这是一个文本分类问题。 最后我得到这样 18.03.2013 01:47:00 Results of ResultWriter

    2热度

    1回答

    我有一个(希望)非常基本的问题。我对Ant非常陌生,我只是试图使用构建文件,所以我可以为我最近发现的开源应用程序Rapid Miner编写一些插件。我一直在试图与Eclipse编译它的每一次点击运行,虽然我得到的,看起来像这样的错误(以下Eclipses.org自己如何做到这一点的说明。): Buildfile: C:\Users\jcarr14\Eclipse\Workspace\RapidMi

    1热度

    1回答

    我正尝试将一个大的csv文件(大约18G)加载到rapidminer中以构建分类模型。 “导入配置向导”似乎很难加载数据。因此,我选择使用“编辑参数列表:数据集元数据信息”来设置属性和标签信息。但是,UI界面只允许我逐列设置这些信息。我的csv文件大约有80000列。我应该如何处理这种情况?谢谢。

    4热度

    3回答

    在RapidMiner中我有一个文本分类过程。它从指定的excel ssheet中读取测试数据并进行分类。我也有一个小型的Java应用程序正在运行这个过程。现在我想在我的应用程序中创建文件输入部分,以便每次我都能够从我的应用程序(而不是从RapidMiner)指定excel文件。 任何提示? 这是代码: import com.rapidminer.RapidMiner; import com.r

    0热度

    1回答

    当创建新的操作员时,我们创建输入端口来接收数据和输出数据的端口。对于我们固定它的数据类型等每个输入端口: exampleSetInput.addPrecondition ( new ExampleSetPrecondition ( exampleSetInput, Ontology.ATTRIBUTE_VALUE)); 而且我们定义像输出中端口的数据类型: get