opennlp

1热度

1回答

我刚刚使用OpenNLP作为一个小程序，我应该把段落分成几个句子。尽管在阅读完一些文档并完成测试用例之后我能完成任务，但我仍然不得不注意到，即使创建了所有缩写（例如Yahoo!）一个自定义的缩写字典，将它传递给SentenceDetectorFactory并用它来训练SentenceDetectorME。我正在使用与此test case中使用的类似方法。我在他们的文档中找不到这种行为，也找不

0热度

1回答

Python的OpenNLP包装 - 标记生成器停在\ n

我（在OS X上工作）对本OpenNLP包装为Python的一个问题：https://github.com/rohithb/openNLP-python-wrapper 出于某种原因，句子检测器不能正常工作，使用这种包装。我对此感到满意，只需切换到由NLTK提供的句子检测器即可。当我将输出反馈回OpenNLP Tokenizer时，麻烦就开始了。下面是一些示例代码： import opennlp

1热度

1回答

我正在制作自然语言处理应用程序，但型号太大

我正在制作一个可以进行自然语言处理的Android应用程序。该应用程序本身工作正常，除了模型OpenNLP给予大，所以apk是太大的分布。我该怎么做才能让apk变小？我想使用一个服务器做NLP，但我不知道如何去它

10热度

1回答

java中的RNTN实现

我想在java中实现一个递归神经张量网络（RNTN）。我已经使用了word2vec管道的Deeplearning4j矢量化单词的语料库。的NLP管道我用Opennlp。（对于符号化，POStaging和解析）现在，我想通了，我需要一个RNTN我的目的，我没有找到太多的支持，任何引用有帮助。许多库都是用R或Python编写的，甚至在Scala和NLP管道中编写的，大多数人使用的都是stanfo

2热度

2回答

对大写文本进行命名实体识别

如何从大写文本中提取实体。我用 - http://corenlp.run/ 测试数据 - 我知道TOM住在伦敦。 LONDON - 位置 TOM - 没有确定关系没有确定测试数据 - 我知道汤姆住在伦敦。汤姆 - 人伦敦 - 位置关系正确标识。如何改进此操作？

2热度

1回答

认识上我目前使用OpenNLP UIMA用一个句子来标记词用NLP

名词短语多个命名实体类型。一个单词可以多次标记很重要。例如David Cronenberg应该被标记为director和person。我知道训练过程中被正确执行，因为我有一个自定义的模型文件，当用一个标签所有句子从模型文件中删除检测到其他标签。我想最好能够继续使用OpenNLP翻一番标签的话。有没有办法做到这一点？如果不是这样的话，这可能与另一个库如斯坦福CoreNLP。一个获取标签的代码如

3热度

1回答

OpenNLP Tokenizer中的圆括号

我使用OpenNLP java将字符串转换为令牌。但是，我发现圆括号不能被正确识别。我使用的代码： ` InputStream is = new FileInputStream("en-token.bin"); TokenizerModel model = new TokenizerModel(is); Tokenizer tokenizer = new TokenizerME(model)

2热度

2回答

Python的 - 组顺序的数组成员

我想修改我的文字是这样的： arr = [] # arr is full of tokenized words from my text 例如： "Abraham Lincoln Hotel is very beautiful place and i want to go there with Barbara Palvin. Also there are stores like Adida

1热度

1回答

在R：我如何解决POS标记器中的“内存不足”错误？

在R中，我有一个30个记录样本的数据，主要数据有20000条记录。记录是推文。我从任何推文中提取bigrams，并使用postagger。对于样本数据，所显示我的错误 .jnew("opennlp.tools.postag.POSModel", .jcast(.jnew("java.io.FileInputStream", : java.lang.OutOfMemoryError: Java h

0热度

1回答

OpenNlp不区分大小写的位置查找器

我想获取一个句子中提到的位置的名称。一切工作正常，直到找到一个位置名称与小首字母。那么有什么办法可以解决这个问题吗？我是否需要培训我自己的模型文件？任何帮助将不胜感激。