2012-10-03 167 views
1

我试图获得一个句子的主要主题,即一个句子在说什么(不是可能不同的语法主题)。NLP - 句子主语

到目前为止,我已经得到了

1)OpenNLP在Java是为了给我一句话检测,词性标注,分析,分词和名称查找。

2.)MatlParser,斯坦福解析器 - 它可以通过依赖解析给出一个简单句子的语法主题。

我觉得一个名词或名词短语总是会有更广义的意义,但是一个句子可以有很多名词和名词短语。 任何帮助将不胜感激。

回答

7

正如您正确指出的那样,语法不够。人们不得不使用某种形式的浅层语义分析来确定你称之为“主体”的东西。我相信在SRL(语义角色标签)的背景下,它更经常被称为Agent。有一些开源工具(例如UIUC SRL parser)可以执行语义角色标注,至少对于英语而言,但它们通常在单独的谓词上工作,其中一个句子中可能有多个谓词,所以必须找出哪个“subject”是“主”一个。

我不认为后者的概念是明确定义的,事实上,就像在一个复杂的句子中,可能不清楚哪个主题是“主”主题。对某种特定类型的句子可能更有意义,但不一般。如果你描述了你正在使用的数据和/或给出了一些例子,我认为这会有所帮助。

P.S.你可能会考虑问这个问题https://linguistics.stackexchange.com/