opennlp

    0热度

    2回答

    我工作(R与openNLP)从提供的语句中提取数字数据。 的语句是"The room temperature is 37 to 39 C. The Air flow is near 80 cfm". 这里的预期输出"Temperature > 37 - 39c","Air flow -> 80cfm"。 你可以建议POS标签上的任何正则表达式模式来获得名词(NN)和下一个可用的数字数据(CD)吗?

    0热度

    1回答

    我想创建一个交互式markdown文件使用闪亮,我面临与使用ggplot与使用rJava的库的问题。使用rJava似乎不会造成问题。 我不得不使用openNLP因为我想要做一些文字采矿和它造成的文件,当我使用的渲染一个renderPlot情节ggplot(完全无关的使用openNLP)正是第二次崩溃。 我后来注意到这种情况发生在我刚导入任何使用rJava的库时。 一些图书馆我尝试,得到了相同的反应

    2热度

    3回答

    我目前正在开发一个项目,我正在接收电子邮件,使用电子邮件包剥离邮件正文,然后我想用体育,政治,技术等标签对它们进行分类。等等...我已经成功地从我的电子邮件中删除了邮件正文。我期待着开始分类。 为了制作多个标签,如运动,科技,政治,娱乐等,我需要每个标签的一组词语来制作标签。举例 体育标签将标签数据:足球,足球,曲棍球...... 我在哪里可以找到网上的标签数据,以帮助我吗?

    1热度

    1回答

    我想训练一个模型中使用opennlp分类鸣叫。我的问题是我应该在用于训练模型的tweets上执行标记化,停止单词删除等操作,还是应该直接使用tweet而不执行消毒处理?

    0热度

    3回答

    我正在开发OpenNLP项目并遇到一些诸如特征生成等内容。 “功能”一词到底意味着什么?如果你可以用laymans术语解释它,那将是非常好的

    1热度

    2回答

    我已经尝试过许多NER工具(OpenNLP,Stanford NER,LingPipe,Dbpedia Spotlight等)。 但是,经常回避我的是一个基于地名词典/字典的NER系统,其中我的自由文本与预先定义的实体名称列表相匹配,并且可能的匹配被返回。 这样我可以有各种像PERSON,ORGANIZATION等列表我可以动态更改列表并获得不同的提取。这将大大减少培训时间(因为其中大部分都基于m

    0热度

    1回答

    我试图使用最大熵分类器的OpenNLP实现,但它似乎文档是相当缺乏,尽管这个库显然设计为易于使用我无法找到一个单一的例子和/或规范的输入文件格式(即训练集)。 任何人都知道在哪里可以找到这个或一个最小的培训示例?

    1热度

    1回答

    我在我的项目中探索Apache OpenNLP产品,其中一个要求是在我的案例中坚持训练有素的DB - Mongo DB/couchbase模型。 现在主要是我期待的文档分类模型输出存储数据库,这样我就不必重新运行,除非它修改 我看到库中的类不能序列例如DocumentCategorizerME和我得到json deserilization异常,如果我试图检索持久性记录,所以想知道是否有人已经这样做

    1热度

    2回答

    我在解决方案中有两个单独的项目。 第一个项目是只是一个测试控制台项目。 而第二个项目是公共库项目。 我有静态类Common Lib包含需要读取文件(用于OpenNLP)的静态方法的项目。 var sentenceDetector = new EnglishMaximumEntropySentenceDetector("EnglishSD.nbin"); 我添加文件 “EnglishSD.nbi

    0热度

    1回答

    我曾经使用斯坦福CoreNLP,我想这次调查OpenNLP。 是否可以创建自己的Annotator?例如,我想分析一个文本并仅挑选颜色或飞机名称。 斯坦福NER让我创建自己的NER模型来做到这一点。 任何建议? 谢谢