我知道live.dbpedia.org更接近dbpedia.org数据的实时版本,但这引起了一个问题:常规dbpedia提取/更新过程运行的频率如何?数据转储多久更新一次?另外,据说主要端点除了维基百科提取的内容之外还包含其他数据集。live.dbpedia.org,dbpedia.org和dbpedia数据转储之间的数据差异是什么?
dbpedia.org,live.dbpedia.org和数据转储之间的数据有什么不同?
我知道live.dbpedia.org更接近dbpedia.org数据的实时版本,但这引起了一个问题:常规dbpedia提取/更新过程运行的频率如何?数据转储多久更新一次?另外,据说主要端点除了维基百科提取的内容之外还包含其他数据集。live.dbpedia.org,dbpedia.org和dbpedia数据转储之间的数据差异是什么?
dbpedia.org,live.dbpedia.org和数据转储之间的数据有什么不同?
我做了一些研究DBpedia中的一个项目,我会和大家分享我发现:
http://dbpedia.org/sparql:此端点使用的大多数数据集从DBpedia Downloads 2014(WayBackMachineLink)。有关其正在使用的数据集的完整列表以及更多信息,请访问此站点:Datasets Loaded 2014(WayBackMachineLink)。那么下载更新的频率如何?请参阅下载的changelog。
http://live.dbpedia.org/sparql:该终点正在使用来自DBpedia live的数据。如果你看看live changesets,你可以看到有时它至少每小时更新一次,有时像在2014年9月每月只更新一次。 DBpedia中是怎么说的:
问:DBpedia中的实时更新(变更)具有结构年/月/日/小时/ xxxx.nt.gz。这是什么意思,如果两者之间有差距,例如某个小时的文件夹丢失了?
答:这意味着服务在当时已经关闭。
而且DBpedia live - 3. new features(WayBackMachineLink)说:
同步工具的5. 发展:同步工具使DBpedia的现场镜保持同步与我们的生活端点。它依次下载变更集文件,解压缩它们,并将它们与另一个DBpedia Live镜像集成。
所以我认为,如果您在应用变更集时与实时终端节点同步,那么实时终端节点也将应用变更集。
你能澄清这个问题吗?在“其中有些行为不一样”不会告诉我们你看到了什么差异。 [DBpedia Live](http://wiki.dbpedia.org/DBpediaLive)说,“DBpedia被认为是维基百科的语义网镜像,随着时间的推移,维基百科的文章被修改,这使DBpedia中的数据过时。 DBpedia Live将保持DBpedia始终与维基百科同步。“除此之外还有更多吗? – 2014-10-03 17:55:28
@JoshuaTaylor这个问题当然更多。所以我试图重写整个问题。也许现在它已经更新了,你可以看到我困惑的东西。 – Kristian 2014-10-03 18:28:03