2015-09-06 69 views

回答

3

要添加到@ abarisone的回答,实际的同义词集标识本身可以共发现3.0和共发现3.1 :(

之间的不同。例如,在共发现3.1 椅子103005231-n

然而,共发现3.0它103001627-N,但你可以不看,最多在http://wordnet-rdf.princeton.edu/wn31/103001627-n也不http://wordnet-rdf.princeton.edu/wn30/103001627-n,而是你需要使用http://wordnet-rdf.princeton.edu/wn30/03001627-n它错误地重定向到102992974-n

我认为这是WordNet RDF 3.1 online app中的一个错误,因为102992974-n没有正式存在。你甚至无法搜索它(包括在线和离线)。如果您在该页面上获得RDF/JSON-LD文件,它会为您提供103005231-n

wn3.1.dict/dict/index.noun

chair n 5 4 @ ~ %p + 5 2 03005231 00599171 10488547 03275941 03005700 

有没有提到02992974在该文件中的任何地方。

这两个问题都令人困惑。我想知道他们为什么在小版本中更改synset ID。


关于共发现同义词集ID的状态:

结论是,目前,共发现使用同义词集合3.0 IDS是最安全的。

对于未来的工作,可以考虑使用来自Global Wordnet Association(即将推出)的跨语言索引。其中将具有与Wordnet 3.0兼容的ID。从wn-users mailing list, 30 Oct 2015

参考文献:

来源:拉斐尔,尼古拉

的URI从“dblocation”领域,这是一个字节从有关基于字符的数据库开始偏移 建文件(我是 不知道哪个)。这将从发布变为发布,因为项目被删除并添加并移动了 。

来源:彼得·克拉克

据我所知...。仅供参考,一个鲜为人知的事实是,除了感官被拆分或合并之外,感应键(例如,“能力%1:07:00 ::”)在版本 之间是稳定的。这为 提供了一种稳定的方式,指的是跨版本的同义词集,而不是使用synset号码。还有 你可以通过寻找相同的感觉键找到不同版本中synset数字之间的映射。 (sensekey-> synset是一个多对一的 映射:一个synset可能有多个感应键,每个对应于synset中的每个 单词+ sense,但感应键恰好映射到一个synset。 祝你好运,皮特

来源:约翰·麦克雷

你好亨迪,

是共发现同义词集标识符是基于字节WordNet中的一个给定的释放 描述符的偏移,因为这样他们远离 稳定不同版本的WordNets。感觉标识符更稳定,但仍然可能不可靠,因为感觉会被分割和合并。 此外,还有两个略有不同的WordNet 3.1版本和 WordNet RDF版本可以接受来自其中的同义词标识符......当然这是 ,正如其他人所评论的那样,都非常混乱。

出于这个原因,全球共发现协会已经开始了 跨语种的指数,我们预计很快(即在时间 在一月份全球共发现会议)上线工作,并给每个 同步一个不变的URI。

皮克·沃森最近发表了讲好这个和这个幻灯片是 在线浏览:http://ldl2014.org/slides/Vossen-LOD-CILI.pdf

就目前而言,我会建议使用WN 3.0标识符链接 同义词集,其中共发现际指数也将基于。

Regards,John

0

如果你看看WordNet's Current Version section下,你会发现:

最新的Windows版本的WordNet 2.1是在3月份发布的 2005. Unix/Linux/Solaris /等版本3.0。于2006年12月发布。版本3.1目前仅在线提供。

而且,在谈论版本3.0和3.1的区别,你可以阅读:

共发现3.1数据库文件ONLY

你可以从这里下载的WordNet 3.1数据库文件。请注意, 这不是上述的完整软件包,也不包含用于运行WordNet的任何 代码。但是,您可以用这些文件替换3.0本地安装的 数据库目录中的文件,并使用 替换WordNet接口中的文件,从3.1 数据库返回条目。这只是WordNet 3.1 数据库文件的压缩tar文件。

所以区别在于WordNet 3.1仅在线,但可以替换3.0版本的数据库并使用本地安装。

你可以找到有关版本3.0 here的文档。