2011-09-07 66 views
3

我想用Python找到两个单词之间的相关性(不相似)。在Perl here中实现了hso(Hirst和St-Onge,1998),lesk(Banerjee和Pedersen,2003)和vector(Patwardhan,2003)算法,但是我似乎在nltk lib中找不到Python。如何在使用Python的Wordnet中查找相关性

我需要使用Python,因为它是Python中较大团队项目的一部分。任何线索?

回答

4

还有一个你可以访问的web界面 - 你大概可以编写一个python客户端来查询web界面来获取lesk或vector值。

您可以在这里找到这些网页界面...

http://marimba.d.umn.edu http://talisker.d.umn.edu

祝你好运, 特德

+0

泰德彼德森!哇!! Hi Ted正在思考同样的问题......但由于我有一个可检测的字对的不同组合的大文件,意识到这需要太多的计算时间......任何解决方法您都可以建议??谢谢! ! – user926321

2

如果您已经有perl实现,为什么不直接写一个调用perl代码的python包装呢?这样你的python项目就可以利用这些功能,而且你不必重写实际的算法。 nltk中有很多东西已经完全按照这种方式工作。

4

我用NLTK加载共发现到Neo4j图形数据库中(见https://groups.google.com/d/topic/gremlin-users/C1OlTG9xCpo/discussion)。

我使用灯泡(http://bulbflow.com/)创建一个名为WordGraph的库,用于通过Rexster REST服务器(https://github.com/tinkerpop/rexster/wiki/)与Neo4j/WordNet进行交互。

灯泡是一个Python库,允许您使用图形编程语言Gremlin(https://github.com/tinkerpop/gremlin/wiki)来查询/遍历Neo4j,在这种情况下,特别是WordNet。

我正在将WordGraph发布到Github(https://github.com/espeed/wordgraph) - 如果您有任何问题,请通知我。

+0

你必须使用Gremlin吗?我见过的Neo4J的所有培训材料都使用Cypher,但我真的很想在GraphDB中使用Wordnet。 –

+0

有关使WordGraph可用的更新? –