opennlp

    1热度

    1回答

    我使用OpenNlp的训练API识别了我教授的技能,训练了一个含有超过一百万个句子的自定义NER模型。在测试过程中,我发现识别技能和技能子串的模型。例如,我已经教了一门技能'Core Java',如果句子有'Core'这个词,那么我的模型会将其识别为一项技能。我想避免这种情况。如果整个单词出现在测试语句中,我只想识别出'Core Java'这个单词。 如何提高我的自定义模型为上述结果?

    1热度

    2回答

    我试图用openNLP上可在这里moview审核数据集上的情感分析工作:http://www.cs.cornell.edu/people/pabo/movie-review-data/(极性数据集V2.0) 我如何可以训练文档分类模型,利用该openNLP数据集? 它由相当数量的评论组成,已被列为不同的文件夹集。 openNLP需要输入一个文件,每个检查都带有一个带有类别标签前缀的新行。我正在寻找

    1热度

    1回答

    对不起,我是新手在NLP。 我使用opennlp创建AI,以便将同义词放入原始文本中并将它们显示给网站。 例如:如果我按:我去学校,AI会告诉我“去”的同义词,“大学”或“高中”的“学校”同义词 我尝试使用named实体识别为此目的,但它不可能。 任何人都可以帮助我吗?

    0热度

    1回答

    我需要比较下面的数组,并检查是否有类似的单词,如果有类似的单词,然后执行另一个任务。这里的tockanization我已经使用Apache open NLP。 import opennlp.tools.tokenize.SimpleTokenizer; public class SimpleTokenizerExample { public static void main(Strin

    1热度

    1回答

    我在尝试创建自定义模型时遇到了一个问题。问题是我创建了一个基于培训文件的自定义模型,培训成功。 但是,当我使用样本输入测试模型(实际上是从训练文件本身获取它)时,这不会给出任何输出。 我甚至尝试了超过15000个句子,但它从来没有给我一个输出。 1.代码尝试: - package com.tcs.ai.opennlp.anothercustommodel.anothercustommodel;

    0热度

    1回答

    我正在使用我正在为自己的用例进行培训的自定义模型。我的用例是根据它是否是地址变更请求来分类电子邮件。如果地址变更请求可以从一个句子中理解,它可以正常工作,没有问题。但是,如果地址变更请求需要从多个句子中理解,则不起作用。 给予几个例子如下: - 例1: - 这是工作一)培训文件: - Guys I wish to <START:contactupdate> change my address <E

    0热度

    1回答

    运行我的Java Web应用程序时出现错误。在这里我有一个servlet类和一个用于Apache openNLP文本分析的类。以下是我的这两个类的2个代码。 01. My servlet Class code 02. My OpenNLP Class code 当我运行这段代码(提交我的表单数据与Servlet)我得到下面的错误代码在浏览器中 而且它显示了以下异常详细信息在eclipse控制台中。

    1热度

    1回答

    如何将OpenNLP模型添加到我的Java Web应用程序类路径中?我只是将“en-parser-chunking.bin”文件复制到我的Java Web应用程序src文件夹中。但它给了我没有发现异常的类。在tomcat 9中将这个文件添加到我的类路径中的正确方法是什么? Open NLP Tools Models

    1热度

    1回答

    我正在尝试使用OpenNLP对发票进行分类。根据它的描述,我将它分成两类。我已经构建了一个包含20K描述的培训文件,并将其标记为正确的类。 训练数据看起来像(第一列是一个代码,即我的类中使用,而第二列是发票说明): 85171231 IPHONE 5S CINZA ESPACIAL 16GB (ME432BZA) 85171231 Galaxy S6 SM-G920I 85171231 mot

    1热度

    2回答

    我正在尝试使用某些nlp技术在以下文本行中找到课程。 from nltk import word_tokenize, pos_tag, ne_chunk sentence = "SDGI is offering courses like Electronics,Mechatronics, Physics,Mechanical Engineering" print ne_chunk(pos_t