2012-04-01 42 views
7

想知道是否有任何工具可以帮助我在文本中检测代词的名称。检测代词及其名词?

Jone is Spanish. He can speak German. 

我如何标记HeJone

回答

12

您试图解决的问题被称为anaphora resolution。执行此任务的java工具可用here。源代码在该站点上提供。关于它是如何工作的理论看看,请查看由Lappin和Leass从1994年开始的this paper.

+1

它是唯一可以做照应解析的工具。有没有其他工具可用.. – 2012-04-01 08:18:34

+1

@ user1234770没有,有很多。如果您想深入了解丰富的api,那么stanford javaNLP套件中有一个名为dcoref的工具。你可以阅读[这里](http://nlp.stanford.edu/software/dcoref.shtml)并阅读javadocs [here](http://nlp.stanford.edu/nlp/javadoc/javanlp/) 。快乐狩猎。 – Cameron 2012-04-01 08:31:49

+1

owky我会,谢谢卡梅隆:) – 2012-04-01 11:35:05

5

您是否在寻找coreference解析工具? 关于一些可用工具,有一个简短的blog。大部分都是用Java编写的,如ArkRef,BART,以及斯坦福大学CoreNLP中的一个。

+0

嗨肯尼斯。我曾试过斯坦福大学的CoreNLP,它适用于我,但仍然无法检测到来自动词的名称,例如讲师,歌手分机......你认为其他工具能够检测到这些名字! – 2012-04-02 04:19:32

+2

你可以阅读我的答案为您的类似问题:http://stackoverflow.com/questions/9561370/how-can-i-differentiate-between-a-persons-name-and-other-names-that-are-derived/9561664#9561664 – 2012-04-02 08:15:30