2008-10-09 160 views
25

我正在寻找一个简单但“足够好”的java命名实体识别库(和字典),我期待处理电子邮件和文档并提取一些“基本信息”,如: 名称,地点,地址和日期为Java命名实体识别库

我一直在环顾四周,而且大多数人似乎是在沉重的一面和完整的NLP类型的项目。

有什么建议吗?

回答

1

顺便说一句,我最近遇到了OpenCalais这似乎有我正在寻找的功能。

+2

其不开源。 – wolfgang 2013-10-28 03:49:34

22

你可能想看看my earlier answers之一到类似的问题。

除此之外,大多数较轻的NER系统在很大程度上取决于所使用的域。例如,您会发现很多关于生物医学NER系统的工具和论文。除了我以前的帖子(如果你想要做的NER已经包含我的主要建议),这里有更多的工具,你可能要考虑:

一个额外的评论:如果没有标记输入,你不会离开。自然语言的标记化是微不足道的,这就是为什么我建议你使用一个工具箱来为你做。

+0

GENIA恶搞/一样标记生成器的工作原理以及斯坦福分析器的内置标记生成器! – nflacco 2011-07-09 22:50:15

0

您也可以尝试Alchemy API。它类似于开放加莱。

相关问题