2013-03-21 68 views
0

我想获得不同语言的主要新闻网站的列表。有没有提供RDF格式大部分主要网站详细信息的提供商?联机新闻网站的RDF数据

+0

RSS 1.0是纯粹的RDF,所以你可以寻找那些提供场所。否则,你可以尝试在http://sindice.com上搜索与新闻有关的类或属性。我的猜测是,纽约时报会出现,因为他们涉及的rNews词汇表可以用于微数据或HTML中的RDFa以标记文章等。 – 2013-03-21 14:06:03

+0

等待,您要求提供一套关于新闻机构的三元组。 .. – 2013-03-21 17:52:38

+0

@ BenCompanjen,是的,我试图找出所有(或我们得到的)新闻网站。我正在构建一个应用程序,我想知道哪一个是新闻网站。如果它是新闻网站,那么我必须禁用页面的缓存。所以如果我有我的新闻领域,那么我不会缓存这些新闻网站的所有页面。 – vinod 2013-04-09 15:12:51

回答

1

DBpedia包含来自Wikipedia的信息,并具有SPARQL端点。维基百科中有一些相关类别可能会帮助您找到所需的信息。例如,我们可以选择各个新闻网站,并得到302个结果:

SELECT * WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
} 

SPARQL results

这是一个有点难以可靠地走出其它信息,因为有些信息可能不可用的页面,或者相同的信息可能出现在具有不同属性的不同页面上。例如,一些这些页面的记录自己的新闻网站与dbpprop:web

SELECT * WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { ?newsSite dbpprop:web ?web } 
} 

SPARQL results

其他人使用dbpprop:website。您可以将之前的查询中的dbpprop:web替换为dbpprop:web|dbpprop:website,尽管在DBpedia端点上运行速度稍慢。你可以更详细,用这个代替:

SELECT ?newsSite ?web WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { 
    { ?newsSite dbpprop:web ?web } 
    UNION 
    { ?newsSite dbpprop:website ?web } 

    } 
} 

SPARQL results

这仍然只得到网站为这些页面屈指可数。有些更用dbpprop:url,因此,我们有以下几点:

SELECT ?newsSite ?web WHERE { 
    ?newsSite dcterms:subject category:News_websites . 
    OPTIONAL { 
    { ?newsSite dbpprop:web ?web } 
    UNION 
    { ?newsSite dbpprop:website ?web } 
    UNION 
    { ?newsSite dbpprop:url ?web } 
    } 
} 

SPARQL results

+0

非常感谢你。我会用这个。 – vinod 2013-06-05 07:16:14