opennlp

    0热度

    1回答

    我的申请要求我指出一个短语的头(名词或动词)。我有这样的信息在我的葡萄牙语文集: 我PRON-个人* B-NP pergunto V-鳍B-VP 森佩尔进阶* B-ADVP 终止日期PRON-INDP * B-NP podia v-鳍B-VP 叔v-INF I-VP SIDO v-PCP I-VP aquele PRON-DET B-NP jovem形容词I-NP Alemao的N * I- NP

    1热度

    2回答

    我曾尝试使用SourceForge中的OpenNLP工具1.5从文本中获取命名实体。我在OpenNLP下载中找到了JWNL文件。这是否意味着OpenNLP反过来将WordNet用于命名实体识别。 (具体来说,这是否意味着名称模型文件是使用WordNet生成的)?

    9热度

    1回答

    好吧,我有下面的代码从OpenNLP FileReader fileReader = new FileReader("train.txt"); ObjectStream fileStream = new PlainTextByLineStream(fileReader); ObjectStream sampleStream = new NameSampleDataStream(fileStre

    18热度

    2回答

    我想POStag英语句子,并做一些处理。我想使用openNLP。我把它安装 当我执行命令 I:\Workshop\Programming\nlp\opennlp-tools-1.5.0-bin\opennlp-tools-1.5.0>java -jar opennlp-tools-1.5.0.jar POSTagger models\en-pos-maxent.bin < Text.txt 它

    2热度

    1回答

    我正在尝试使用OpenNLP进行标记化。我不知道有什么问题。以下是例外情况: opennlp.tools.util.InvalidFormatException: Missing the manifest.properties! at opennlp.tools.util.model.BaseModel.validateArtifactMap(BaseModel.java:209)

    3热度

    2回答

    这是一个我们计划拥有的在线编程比赛。 什么可能的解决方法? 从随机IRC(Internet Relay Chat)日志中,一小部分用户昵称将被随机删除。参与者的代码必须能够填写缺少的用户刻痕。换句话说,这个事件要求你想出一个智能程序,可以找出“谁可以说什么”。 可以假设所有的沟通都是现代英语,有或没有标点符号。 例如 - 原始聊天: ... <user1>: Hey! <user2>: Hello

    0热度

    1回答

    我需要生成一个unigrams向量,即所有出现在特定文本字段中的所有唯一字词的向量,该字段作为MongoDB中更广泛的JSON对象。 我不确定什么是最简单和最有效的方式来生成此向量。我正在考虑编写一个简单的Java应用程序来处理标记(使用OpenNLP之类的东西),但我认为更好的方法可能是尝试使用Mongo的Map-Reduce功能来解决此问题......但是,我并不是真的当然我该怎么做。 另一个

    4热度

    1回答

    我正在使用OpenNLP从给定文本中提取命名实体。 在大数据上运行代码时,它给了我以下错误。当我在小数据上运行它时,它工作正常。 java.lang.NullPointerException at opennlp.tools.util.Cache.put(Cache.java:134) at opennlp.tools.util.featuregen.CachedFeature

    13热度

    2回答

    有没有办法使用OpenNLP获得一个句子的主题? 我试图找出用户句子中最重要的部分。一般来说,用户会将句子提交给我们的“引擎”,我们想要确切知道该句子的核心主题是什么。 目前我们使用的openNlp到: 块中的句子 确定的名词短语,动词等句子的 找出句子 的所有的“主题”( )确定句子的“核心主题” 请让我知道你是否有任何明智的想法..

    1热度

    1回答

    所有的词性(POS)标记都以简码(NNS,VBZ等)的形式给出标签。 此/ DT页/ NN是/约/ IN的/ DT布瑞尔-标注器/ NNP 如同上面的例子是从online POS Taggers之一VBZ。 我在哪里可以找到每个简码的含义?