opennlp

0热度

1回答

我的申请要求我指出一个短语的头（名词或动词）。我有这样的信息在我的葡萄牙语文集：我PRON-个人* B-NP pergunto V-鳍B-VP 森佩尔进阶* B-ADVP 终止日期PRON-INDP * B-NP podia v-鳍B-VP 叔v-INF I-VP SIDO v-PCP I-VP aquele PRON-DET B-NP jovem形容词I-NP Alemao的N * I- NP

1热度

2回答

OpenNLP是否使用名为实体识别引擎盖下的WordNet

我曾尝试使用SourceForge中的OpenNLP工具1.5从文本中获取命名实体。我在OpenNLP下载中找到了JWNL文件。这是否意味着OpenNLP反过来将WordNet用于命名实体识别。（具体来说，这是否意味着名称模型文件是使用WordNet生成的）？

9热度

1回答

如何在OpenNLP中训练指定的实体识别器标识符？

好吧，我有下面的代码从OpenNLP FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ObjectStream sampleStream = new NameSampleDataStream(fileStre

18热度

2回答

如何在Java中使用OpenNLP？

我想POStag英语句子，并做一些处理。我想使用openNLP。我把它安装当我执行命令 I:\Workshop\Programming\nlp\opennlp-tools-1.5.0-bin\opennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.jar POSTagger models\en-pos-maxent.bin < Text.txt 它

2热度

1回答

如何解决OpenNLP中的“Missing the manifest.properties”？

我正在尝试使用OpenNLP进行标记化。我不知道有什么问题。以下是例外情况： opennlp.tools.util.InvalidFormatException: Missing the manifest.properties! at opennlp.tools.util.model.BaseModel.validateArtifactMap(BaseModel.java:209)

3热度

2回答

如何识别长多用户互联网聊天记录中的特定用户？

这是一个我们计划拥有的在线编程比赛。什么可能的解决方法？从随机IRC（Internet Relay Chat）日志中，一小部分用户昵称将被随机删除。参与者的代码必须能够填写缺少的用户刻痕。换句话说，这个事件要求你想出一个智能程序，可以找出“谁可以说什么”。可以假设所有的沟通都是现代英语，有或没有标点符号。例如 - 原始聊天： ... <user1>: Hey! <user2>: Hello

0热度

1回答

从MongoDB中的文本字段生成Unigrams列表的最有效方法

我需要生成一个unigrams向量，即所有出现在特定文本字段中的所有唯一字词的向量，该字段作为MongoDB中更广泛的JSON对象。我不确定什么是最简单和最有效的方式来生成此向量。我正在考虑编写一个简单的Java应用程序来处理标记（使用OpenNLP之类的东西），但我认为更好的方法可能是尝试使用Mongo的Map-Reduce功能来解决此问题......但是，我并不是真的当然我该怎么做。另一个

4热度

1回答

在NameFinderME类中使用OpenNLP的空指针异常

我正在使用OpenNLP从给定文本中提取命名实体。在大数据上运行代码时，它给了我以下错误。当我在小数据上运行它时，它工作正常。 java.lang.NullPointerException at opennlp.tools.util.Cache.put(Cache.java:134) at opennlp.tools.util.featuregen.CachedFeature

13热度

2回答

有没有办法使用OpenNLP获得一个句子的主题？

有没有办法使用OpenNLP获得一个句子的主题？我试图找出用户句子中最重要的部分。一般来说，用户会将句子提交给我们的“引擎”，我们想要确切知道该句子的核心主题是什么。目前我们使用的openNlp到：块中的句子确定的名词短语，动词等句子的找出句子的所有的“主题”（）确定句子的“核心主题” 请让我知道你是否有任何明智的想法..

1热度

1回答

我在哪里可以找到POS标签使用的短代码的扩展？

所有的词性（POS）标记都以简码（NNS，VBZ等）的形式给出标签。此/ DT页/ NN是/约/ IN的/ DT布瑞尔-标注器/ NNP 如同上面的例子是从online POS Taggers之一VBZ。我在哪里可以找到每个简码的含义？