2015-11-06 72 views
2

我正在尝试使用Stanford NLP工具包来评估依赖关系语法。是否可以使用LexicalizedParser类来执行“纯粹”依赖关系解析?

是否有可能让LexicalizedParser类仅使用来自模型文件的DEPENDENCY_GRAMMAR部分的规则?

将模型文件的其他部分留空将导致异常,并且在模型文件中将'doPCFG'标志更改为'false'将导致ExhaustiveDependencyParser.getBestScore中的空指针异常。

看来,LexicalizeParser类将依赖(选区)PCFG当它不能使用的相关性规则解析输入。

这是正确的吗?此行为是否可以关闭,以便可以独立评估依赖关系语法?

回答

2

什么你要找的是Stanford Dependency Parser,只产生了依赖解析器,而不是一个选区解析。相比之下,词法分析器只产生一个选区分析,然后将其转换为转换器的依赖分析。因此,没有选择不产生这个选区分析,并且仍然产生一个依赖分析,因为转换器没有任何转换。

如果你只是在做语法形式主义的评价,但是,你可以考虑使用黄金树的依赖转换器,或使用新的通用依赖注释的数据。

+0

我认为斯坦福依存句法,但它是基于神经网络的,它的模型由特征向量,而不是传统的语法规则。是否有可能加载依赖语法,还是仅仅是对它进行培训? –

+0

就我所知,就PCFG语法分析器的语法而言,没有“依赖语法”这样的东西。我所知的所有依赖关系解析器都具有某种类似的依赖关系arc分类器 - 无论是用于在MST算法中对弧进行评分还是在shift-reduce框架中评分解析操作。神经解析器也不例外;它只是使用神经网络作为分类器。 –

+0

当然..我只是想到了LexicalizedParser模型的DEPENDENCY_GRAMMAR部分中使用的那种表示,可以比一个50元素的矢量更容易读取和评估它。 如:' “比/ IN” - > “领头羊/ NN” 左0 1.0' VS '绑-0.6479344878343402 0.5893377057407623 1.0174283134652544 0.7000564156722917 -0.004831055643038269 ... ... ... 0.7715736625830979' –

相关问题