2014-09-25 83 views
3

我正在研究涉及不同概念之间相关性计算的项目。查找不同词语之间的语义相似性和关系

例子: “落地” - 与“到达;来”和“土地”, “电话” - 与“电子,电力”和“谈话;沟通”, “电影“ - 相关:”移动;改变“和”图片;图片“ 等等。

我检查了WordNet框架和WordNet :: Similarity Perl模块,但在某些情况下它们不可用,特别是在需要将名词与动词连接的情况下(例如名词“dog”和动词“大叫”)。此外,WordNet组织所有同层次结构(例如:计算机 - >机器 - >设备 - >仪表),这并不是我真正需要在我的项目中(当然,我可能是错的)。

问题是 - 哪个框架或数据库,我应该用什么方法来解决问题?我从哪说起呢?

如果你能给我一些建议,这将是非常有益的。

+0

你需要组织你的需求的相似性,关系和语义。我认为“登陆”与“陆地”之间的关系以及“登陆”与“到达”之间的关系是不同语义的关系。你可能需要一个可以处理单词之间的语义和关系的框架。 – 2014-09-25 04:27:45

+0

您应该利用WordNet中的“衍生词相关形式”来将名词与动词联系起来。但是......理解概念相关性的“真实”(即research'y)方法是通过使用它们在大型数据集上的分布相似性对词进行建模。 – 2014-09-30 18:39:02

回答

3

word2vec嵌入可能在你的任务上做得很好。它给出了一个比wordnet更柔和的相似概念。您可以从https://code.google.com/p/word2vec/获得一些预先训练好的嵌入。

相关问题