2016-06-07 144 views
1

我从http://downloads.dbpedia.org/2015-04/core/, 下载了一些数据,其中包括:instance-type_en.nt,mappingbased-properties_en.nt和其他一些数据。下载的DBpedia数据不包括所有实例类型的三元组

我已经成功地将它们加载到OpenLink Virtuoso数据库中,但是当我运行一些示例SPARQL查询(例如查询有关主题Xiamen_University的所有三元组)时,会出现问题。

select ?s ?p ?o 
where 
    { 
    ?s rdfs:label "Xiamen University"@en . 
    ?s ?p ?o . 
    } 

从DBpedia的SPARQL端点,有heaps of triplesiamen_University;而在我的分贝中,只有4或5个。

尤其是,在db中没有三元组表示Xiamen_University是一种大学,或者任何实例类型的三元组。我发现在其他一些主题上也有类似的情况。

我认为instance-types_en.nt文件不包括所有来自维基百科的instance-types三元组,与mappingbased-properties相同的问题。是对的吗?如果是这样,我在哪里可以找到正确的源文件?

回答

1

downloads page上有数据集的完整列表。我没有看到很多关于的文档,其中每个文档都有,但名称相当具有描述性,并且每个旁边的问号链接都显示了其中每一种信息的预览。悬停在每个标题将提供一个简短的描述。例如:

screenshot of tooltip

它看起来像得到最有趣的特性,你可能希望mappingbased数据集,与标签沿数据集(因为你写的查询被识别物体标签)。

+0

正如@Joshua所说,基于映射的是后来在'http:// dbpedia.org/ontology /'命名空间中的内容。但大多数数据不是基于映射的,并且属于'http:// dbpedia.org/property /'命名空间。特别是名称以“信息框属性”开头的文件中包含的内容。 – AKSW

相关问题