2014-10-03 64 views
1

我知道live.dbpedia.org更接近dbpedia.org数据的实时版本,但这引起了一个问题:常规dbpedia提取/更新过程运行的频率如何?数据转储多久更新一次?另外,据说主要端点除了维基百科提取的内容之外还包含其他数据集。live.dbpedia.org,dbpedia.org和dbpedia数据转储之间的数据差异是什么?

dbpedia.org,live.dbpedia.org和数据转储之间的数据有什么不同?

+1

你能澄清这个问题吗?在“其中有些行为不一样”不会告诉我们你看到了什么差异。 [DBpedia Live](http://wiki.dbpedia.org/DBpediaLive)说,“DBpedia被认为是维基百科的语义网镜像,随着时间的推移,维基百科的文章被修改,这使DBpedia中的数据过时。 DBpedia Live将保持DBpedia始终与维基百科同步。“除此之外还有更多吗? – 2014-10-03 17:55:28

+0

@JoshuaTaylor这个问题当然更多。所以我试图重写整个问题。也许现在它已经更新了,你可以看到我困惑的东西。 – Kristian 2014-10-03 18:28:03

回答

4

我做了一些研究DBpedia中的一个项目,我会和大家分享我发现:

问:DBpedia中的实时更新(变更)具有结构年/月/日/小时/ xxxx.nt.gz。这是什么意思,如果两者之间有差距,例如某个小时的文件夹丢失了?

答:这意味着服务在当时已经关闭。

而且DBpedia live - 3. new featuresWayBackMachineLink)说:

同步工具的

5. 发展:同步工具使DBpedia的现场镜保持同步与我们的生活端点。它依次下载变更集文件,解压缩它们,并将它们与另一个DBpedia Live镜像集成。

所以我认为,如果您在应用变更集时与实时终端节点同步,那么实时终端节点也将应用变更集。

相关问题