2012-04-19 72 views
0

我目前正在通过opennlp源代码来试图找到/理解它们用于分块的语法。这不是最简单的任务之一。我开始浏览chunkermodel和相关的课程,但没有得到太多......OpenNLP提取语法

有没有人曾经搜过这个?如果有的话,任何建议或想法将使我走上正轨?

回答

1

实际上,与Apache OpenNLP捆绑在一起的算法基于机器学习技术,使用统计学方法。模型中没有语法,但从训练数据中提取参数。

要了解有关算法的更多信息,我推荐Jurafsky & Martin书籍“语音和语言处理”,第6.7节。

您也可以参考Ratnaparkhi的博士论文:Maximun Entropy Models for Natural Language Ambiguity Resolution

而对于感知HMM中,迈克尔·柯林斯纸:Discriminative training methods for hidden Markov models: theory and experiments with perceptron algorithms

如果你要找的是语法的方法,尝试该限制语法形式主义。 VISL website列出了一些出版物。