2017-02-28 83 views
9

是否可以快照Google Cloud Spanner数据库/表格?出于合规性原因,我们必须每天都有当前数据库的快照,在发生灾难时可以回滚到这个数据库中:这在Spanner中是可行的吗?如果不是,是否有意支持它?Google Cloud Spanner的外部备份/快照

对于那些可能会问为什么我们需要它,因为扳手是复制/冗余等 - 它不能防止人为错误(意外丢掉一张桌子)或破坏/间谍活动因此的问题和要求。

感谢,男

回答

8

今天,你可以通过(使用时间戳边界),在特定的时间戳读出用你最喜欢的工具(MapReduce的,火花,数据流)中的所有数据和读出流一致的快照。

https://cloud.google.com/spanner/docs/timestamp-bounds

你有一个小时左右做出口数据获取垃圾回收之前。未来,我们将提供一个Apache Beam/Dataflow连接器,以更具扩展性的方式实现这一点。这将是我们将数据导入/导出到Cloud Spanner的首选方法。从长远来看,我们将支持备份和恢复备份功能,但目前该功能尚不可用。

+1

文档中还不清楚数据集中保存了多少数据副本,以及如果谷歌在发生灾难时内部保留备份。 – onionjake

+0

@onionjake区域配置保留3份数据(https://cloud.google.com/spanner/docs/instance-configuration#configuration) 我们在内部保留备份,所以我们可以帮助您恢复数据你提交支持票。 –

+0

有没有使用数据流/火花来导出数据的例子? –