2016-12-08 73 views
1
建议

我的文档通常包括像句:提取建议/从文本

假如我知道关于这一点,我会避免这个问题

如果约翰通知,这不会发生

这不会是一个问题,如果杰森智能

我感兴趣的提取这些类型的信息(不知道他们叫什么,语言)。所以我想,用于提取整个句子,或理想,一个总结,如:

(通知约翰)(防止)

大多数,如果不是全部,关系抽取的例子,我所遇到的信息抽取,遵循相当标准的流程: 做NER,然后关系抽取查找像“in”或“at”等关系(例如,nltk书的ch7)。

这些类型的句子是否属于NLP中的某个类别?有没有关于这样的文章/教程?

回答

1

当您要求提供一个非常开放的主题建议时,请举出更多示例。我的意思是说,如果你只举一个例子,并解释你瞄准的东西没有提供足够的信息。例如,如果您拥有遵循特定模式的句子,则从它们中提取信息(以您所需的格式)变得更容易。否则,它变成一个广泛而复杂的研究问题!

从你的例子看来,你想提取一个句子的head words和其他修改这些头的词。您可以对此任务使用依赖分析。看看Stanford Neural Network Dependency Parser。依赖分析器分析句子的语法结构,建立“头”字与修改这些头的词之间的关系。所以,我相信它应该可以帮助你完成你期望的任务。

如果你想使它更通用,那么这个问题与Open Information Extraction很好地保持一致。您可以考虑查看Stanford OpenIE api。

你也可以在你的任务中考虑Stanford Relation Extractor api。但我坚信通过依赖关系解析进行关系抽取最适合您的问题定义。你可以阅读这个paper来得到一些想法,并将它们用于你的任务。