opennlp

    1热度

    1回答

    我刚刚使用OpenNLP作为一个小程序,我应该把段落分成几个句子。 尽管在阅读完一些文档并完成测试用例之后我能完成任务,但我仍然不得不注意到,即使创建了所有缩写(例如Yahoo!)一个自定义的缩写字典,将它传递给SentenceDetectorFactory并用它来训练SentenceDetectorME。 我正在使用与此test case中使用的类似方法。 我在他们的文档中找不到这种行为,也找不

    0热度

    1回答

    我(在OS X上工作)对本OpenNLP包装为Python的一个问题:https://github.com/rohithb/openNLP-python-wrapper 出于某种原因,句子检测器不能正常工作,使用这种包装。我对此感到满意,只需切换到由NLTK提供的句子检测器即可。当我将输出反馈回OpenNLP Tokenizer时,麻烦就开始了。下面是一些示例代码: import opennlp

    1热度

    1回答

    我正在制作一个可以进行自然语言处理的Android应用程序。该应用程序本身工作正常,除了模型OpenNLP给予大,所以apk是太大的分布。我该怎么做才能让apk变小?我想使用一个服务器做NLP,但我不知道如何去它

    10热度

    1回答

    我想在java中实现一个递归神经张量网络(RNTN)。 我已经使用了word2vec管道的Deeplearning4j矢量化单词的语料库。 的NLP管道我用Opennlp。(对于符号化,POStaging和解析) 现在,我想通了,我需要一个RNTN我的目的,我没有找到太多的支持,任何引用有帮助。许多库都是用R或Python编写的,甚至在Scala和NLP管道中编写的,大多数人使用的都是stanfo

    2热度

    2回答

    如何从大写文本中提取实体。 我用 - http://corenlp.run/ 测试数据 - 我知道TOM住在伦敦。 LONDON - 位置 TOM - 没有确定 关系没有确定 测试数据 - 我知道汤姆住在伦敦。 汤姆 - 人 伦敦 - 位置 关系正确标识。 如何改进此操作?

    2热度

    1回答

    名词短语多个命名实体类型。一个单词可以多次标记很重要。例如David Cronenberg应该被标记为director和person。 我知道训练过程中被正确执行,因为我有一个自定义的模型文件,当用一个标签所有句子从模型文件中删除检测到其他标签。 我想最好能够继续使用OpenNLP翻一番标签的话。有没有办法做到这一点?如果不是这样的话,这可能与另一个库如斯坦福CoreNLP。 一个获取标签的代码如

    3热度

    1回答

    我使用OpenNLP java将字符串转换为令牌。但是,我发现圆括号不能被正确识别。 我使用的代码: ` InputStream is = new FileInputStream("en-token.bin"); TokenizerModel model = new TokenizerModel(is); Tokenizer tokenizer = new TokenizerME(model)

    2热度

    2回答

    我想修改我的文字是这样的: arr = [] # arr is full of tokenized words from my text 例如: "Abraham Lincoln Hotel is very beautiful place and i want to go there with Barbara Palvin. Also there are stores like Adida

    1热度

    1回答

    在R中,我有一个30个记录样本的数据,主要数据有20000条记录。记录是推文。 我从任何推文中提取bigrams,并使用postagger。对于样本数据,所显示我的错误 .jnew("opennlp.tools.postag.POSModel", .jcast(.jnew("java.io.FileInputStream", : java.lang.OutOfMemoryError: Java h

    0热度

    1回答

    我想获取一个句子中提到的位置的名称。一切工作正常,直到找到一个位置名称与小首字母。 那么有什么办法可以解决这个问题吗?我是否需要培训我自己的模型文件? 任何帮助将不胜感激。