2016-03-16 52 views

回答

0

NER解决方案倾向于特定于域,使用硬编码的字列表作为信号(特征)和/或命名实体的内部字母结构。

英国/美国的名称与其他欧洲名称相似,因为很多流行的美国名字和姓氏都来自非英语的欧洲移民。印度人的名字显着不同,常用的名字/姓氏和训练数据语料库清单通常不包含太多或任何印度特有的数据。

要解决您的问题,您需要根据适合您特定域的数据来训练专门的NER模型。

+0

是否有任何其他选择认可的印度名称实体?喜欢其他开源工具等。@peteris –

相关问题