2017-04-13 67 views
0

我正在研究一个项目,我正在尝试做一些研究。我希望能够使用特定的语料库库找到单词的搭配。我希望有一些SDK可以用来做这种类型的工作。我看着这个选项:创建与特定语料库的搭配

https://nlp.stanford.edu/nlp/javadoc/javanlp/edu/stanford/nlp/trees/CollocationFinder.html

,发现了一个名为CollocationFinder类,但无法找到太多的文件或不知道是否有指定文集的方式。

我还发现一个名为JXtract(http://definingterms.com/projects/Champollion/#smadja93)的项目,但它看起来很老,作者声明它肯定会有错误。

是否有人知道我可以用来开发软件的好库?什么可以选择语料库,还可以选择不同的方法来确定搭配?

+0

我对NLP并不熟悉。但是,考虑到我还没有收到任何答复,我想知道如果我的问题没有意义?或者,也许这是使用当前软件库无法完成的事情? – jason

+0

*“我对NLP不熟悉”。*鉴于您对[tag:jnlp]等标签的有用代码弹出窗口的关注度,我并不感到惊讶。 –

回答

0

由于您没有指定它必须是Java解决方案,因此有a collocationand a concordancerapp built using NLTK (Python)。它符合你的要求(一个好的图书馆[用于NLP],允许[s]选择一个语料库,你自然可以编码任何不同的方法来确定搭配 - NLTK中的TK代表“工具包”!)

+0

是的,这不必在Java中完成。感谢您的建议。我会检查这一个。 – jason

0

Stanford CoreNLP中CollocationFinder类的用途是将单词合并成单个搭配标记。这些搭配可以从WordNet中找到,所以这个类不会帮助从一个语料库中提取自动搭配。