2011-12-18 55 views
4

为什么DBpedia为相同属性使用多个词汇表?
我必须得到所有可能的电影的数据。 对于我观察到,它有一个DBpedia中,猫头鹰和dbpprop词汇制片人,导演等..我检索与下面的查询属性每部电影:为什么DBpedia中的同一属性有2个不同的词汇表?

PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 

PREFIX foaf: <http://xmlns.com/foaf/0.1/> 

SELECT ?star_name 
WHERE { 
<http://dbpedia.org/resource/Goal_III:_Taking_on_the_World> dbpedia-owl:starring ?star. 
?star foaf:name ?star_name 
} 

我要到页面ID每部电影,然后我会检索明星和制作人。对于一些我认为 dbpedia-owl的作品和一些dbpprop作品。

我对此感到困惑。我必须在Python中编写代码才能为每部电影运行此查询。因此,每次我必须检查结果为空,然后运行其他词汇表的代码。

回答

1

DBPedia的数据是使用基于映射的语言从相应维基百科页面上显示的信息框中提取的。不同的映射用于不同的信息框,因此两种不同类型的资源可能完全不同,完全符合逻辑,如果你仔细想一想。

现在你所谈论的问题是具有相同数据映射不同的相同类型的两个资源。我怀疑(虽然不能确认,因为你没有给出两个电影的地图属性不同的例子),这里的问题是维基百科中的数据。可能有多种方法可以在信息框中表达您感兴趣的信息,并且信息框的映射针对不同的方式进行不同的映射。这并不理想,但维基百科没有可爱的清洁数据,所以你不应该期望DBPedia也有干净的数据。

您可以考虑在DBPedia邮件列表上询问关于此问题的DBPedia邮件列表,以尝试找出发生这种情况的原因,因为他们可以更好地帮助您。

相关问题