2011-09-29 93 views
2

我想用尚未实现的另一种语言使用斯坦福解析器。在斯坦福解析器中添加一种语言

我看着网站,但没有发现任何可以帮助我的东西。

我想我要做的是“只是”创建一个新的语言PCFG.ser,但要做到这一点?

另外,如果有人知道如果法国和西班牙语应该被释放?需要

回答

5

几件事情:

  • 你需要从中
  • 你需要特定语言的文件在解析器使用的概率计算的树库(一套手工解析树)(如xLanguagePack, xTreebankParserParams,其指定有关语言,树库编码,并分析选项的东西
  • 然后你训练的树库解析器产生
  • 您可能需要一个语言 - 技术规格语法文件(见makeSerialized.csh的分布) Ç分词器划分文本标记
  • 如果想斯坦福依赖性输出,那么也有一个定义的依赖

从2011年开始以规则为基础层,我们并开始分发法国模式与斯坦福分析器。从2015年开始,我们开始发布西班牙模特。