2011-03-12 62 views
7

有人可以推荐韩国,印度尼西亚,泰国和越南的开源POS tagger吗?韩国,泰国和印度尼西亚POS tagger

我可以用它来标记我目前拥有的语料库数据。 (例如the stanford-postagger

如果你是一名开发人员并且非常关心共享并让我测试POS标记器,我也不介意。

随着输出的一些修改,我POS标记越南数据和jvntextpro

但我还是想对韩国更多的投入,印尼和泰国的词性标注。

回答

5

ACL维基后:Korean morphological analyzer and part-of-speech tagger

我将开始把眼光放在NLP研究部门在韩国,泰国和韩国的网站。 On this page,你会找到研究部门的链接。

祝你好运!

更新:OpenNLP有泰国的PoS。以下是适用于PoS opennlp tagger的型号:http://opennlp.sourceforge.net/models/thai/

+0

http://isoft.postech.ac.kr/Course/CS730b/2005/index.html我在这个页面上找到了韩文标记器。现在泰国tagger失踪了。哈哈..感谢页面,但我们需要一个更好的整理NLP资源。 – alvas 2011-04-16 04:49:36

0

您可能想尝试RDRPOSTagger:一种强大的,易于使用且与语言无关的POS和形态标记工具包。

(编程语言:Python的& JAVA)

RDRPOSTagger获得学习能力和标记过程快速的性能。另外,与最新的结果相比,RDRPOSTagger实现了非常具有竞争力的准确性。在this paper中查看实验结果,包括性能速度和标记精度。

RDRPOSTagger现在支持13种语言(包括泰语和越南语)的预训练POS和形态标注模型。