2014-11-05 84 views
-1

假设句子为“车辆在寒冷天气下不启动,需要更换挡风玻璃叶片。”我有兴趣了解汽车的哪一部分受到影响,原因是什么。从上面的句子来看,我们无法推断风挡玻璃刀片不启动。另外单句可以包含多个汽车零件。如何解决这个问题?如何从POS标签进行语义分析?

+0

你有兴趣'textual entailment'。看看这里:http://www.google.com/cse?cx=011664571474657673452%3A4w9swzkcxiy&cof=FORID%3A0&q=textual+entailment#gsc.tab=0&gsc.q=textual%20entailment&gsc.page=1 – Pierre 2014-11-05 14:27:44

+0

告诉我们关于您的数据,系统的范围以及尝试的内容 – Pierre 2014-11-05 14:29:03

回答

0

我发现解决方案,上面的问题可以很容易地解决在斯坦福的依赖关系的帮助下,所以我们可以使用斯坦福coreNLP。

-1

你打算只关注一个主题(例如汽车零件)吗?

如果是这样,对于一个非常粗略的起点,你可以有汽车零部件字典和少数高频率的n-gram,如“需要改变”,“需要维修”等

的汽车零件的POS总是要成为名词。表示某些需要的动作的n元组将具有动词作为其POS值。

当您检测到表示问题或请求操作的n-gram之一时,您可以查询您的汽车零件列表以查看哪些零件负责或受到影响。请记住,尽管如此,我认为你可能从句法树中受益超过POS。树可以让你分开句子中的两个条款“车辆在寒冷天气下不启动”和“需要更换挡风玻璃叶片”,并在某种程度上将可能是问题一部分的其他汽车部件分开(如果你有很多是从那些简单的文字中提到的。

如果系统意图是多域的,您可能需要深入到语法分析。也许命名实体识别,但这往往是与专有名词的事情。