0
我曾看过斯坦福大学NER和Polyglot。两者都不支持泰米尔语言。 我想用ML和一些基于规则的NLP处理来做实体识别任何人都可以简单介绍一下如何进行泰米尔语言中的命名实体识别吗?
我曾看过斯坦福大学NER和Polyglot。两者都不支持泰米尔语言。 我想用ML和一些基于规则的NLP处理来做实体识别任何人都可以简单介绍一下如何进行泰米尔语言中的命名实体识别吗?
Stanford NER和Polyglot都不是基于规则的。如果您只考虑基于规则的系统,则应该寻找能够正确处理泰米尔语的现有框架,或者转向通用框架(例如GATE)。
看看this paper报告现有泰米尔NER系统,您可以联系作者。
如果您找不到可用的系统,那么使用现有数据集(例如NER-FIRE2013和NER-FIRE2014)来训练一个系统应该相当容易:向组织者询问如何获取这些数据集。
希望这会有所帮助!