2015-09-25 60 views
1

我正在使用dbpedia。在我的工作中,我的程序需要读取dblook json文件(如http://dbpedia.org/data/Germany.json),并将所有信息作为键值对提取,与dbpedia页面(http://dbpedia.org/page/Germany)相同。但是我面临一些问题。例如,如果您看到json文件(请使用一些json查看器来使其具有人类可读性),如果我想要获取语言(文件中的搜索语言),您将看到它在json数组中,所以我必须从数组中提取该信息。另一方面,如果你搜索seeAlso,那么你会发现你必须先上一级并找到信息。此外,HTML页面(http://dbpedia.org/page/Germany)中有一些信息,但在元数据json 文件(http://dbpedia.org/data/Germany.json)中未找到。例如,“birthPlace”在html页面中,但不在json文件中。我完全困惑,我将如何编码,可以读取和存储(作为键值映射)数据就像在html页面中看到的一样。哪个是从dbpedia页面检索所有信息的正确方法?

回答

0

DBpedia数据按资源组织,其中每个“资源”是维基百科上的一个页面,并且(可能)是现实世界中的一个页面。每个资源都通过一个URL来引用。 JSON文件包含一大堆资源(如http://dbpedia.org/resource/Opel_Kadett_C),它们与您感兴趣的资源有一些链接,其中包括http://dbpedia.org/resource/Germany。我认为这应该包含http://dbpedia.org/page/Germany的所有信息,但显然有些条目(如db:Anja_Kling)缺失。我不确定这是为什么,但它可能是一个错误 - 如果您在这里没有得到更好的答案,您应该尝试通过电子邮件将您的问题发送到https://lists.sourceforge.net/lists/listinfo/dbpedia-discussion的dbpedia讨论邮件列表。希望有所帮助!

相关问题