我想添加新的标记词(在本地区使用的本地词)并创建新模型。我从命令行创建了一个.prop文件,但我如何创建一个.tagger文件?我如何在斯坦福Pos tagger中创建我自己的模型?
当我试图创建这样的文件在斯坦福大学网站上提到它显示像
错误“没有指定模型”
什么-model说法,是它的语料库?我怎样才能把我的新标记的单词添加进去?
那我该如何训练一个标记器呢?
你需要开始与包含了 恶搞使用选项.props文件。我们用于创建样本标记器的.props文件包含在模型目录中;您可以从任何一个 看起来最接近您要标记的语言开始。
例如,要训练一个新的英文tagger,请从左边的3个字词开始,然后在tagger props文件中输入 。要为 英语以外的西方语言培训标记器,可以考虑德语或法语 标记器的道具文件,它们包含在完整版中。对于使用不同字符集的语言 ,您可以从中文或 阿拉伯语道具文件开始。或者,您可以使用-genprops选项至 MaxentTagger,它将编写一个样本属性文件,其中包含 文档,供您修改。它将它写入标准输出,所以你要 想通过重定向输出(通常用>)将它保存到某个文件中。 行开头的#使事情发表评论,因此您需要 删除您希望指定的属性之前的#。
这是唯一的描述我从斯坦福大学网站得到的,任何一个以前做过?帮帮我? – 2014-11-23 06:30:34
目前尚不清楚你的问题在哪里。我们无法判断您是否真的拥有.props文件或者是否发现了需要解决的错误/问题。从斯坦福网站粘贴文本不会带来更多帮助;恰恰相反。 – Alfabravo 2014-11-23 06:42:15
我想添加新的标记词(我们地区使用的本地词)并且想要创建新模型.i从命令行创建.prop文件,但我如何创建.tagger文件?当我试图创建斯坦福网站上提到的这样的文件时,它显示“没有指定模型”这样的错误 - 什么是模型参数,它是否是语料库?我怎样才能把我的新标记的单词添加进去? 。我认为现在的问题是清楚的? – 2014-11-24 08:26:17