我一般认为冰川作为替代存储到S3,而不是额外存储。即,数据通常会存储在S3或Glacier中,但很少会同时存在。
如果您相信S3公布的十一个耐久性九,那么您不会备份,因为S3本身很可能会丢失数据。
您可能需要备份数据,因为(像我一样),您将亚马逊帐户视为单点故障(例如,凭据被泄密或亚马逊阻止您的帐户,因为他们认为您正在做一些滥用行为)。然而,在这种情况下,冰川仍然不足以支撑亚马逊雨伞。
如果您担心由于用户错误,凭证泄露等原因而丢失S3中的数据,我建议您在Amazon之外备份S3数据。
我建议使用Glacier作为存放长期低价存储数据的地方,因为如果您知道您不需要访问它,那么这个存储空间会很大。当事情转移到冰川时,你会从S3中删除它们。
亚马逊提供从S3到Glacier的自动存档,效果很好,但是如果文件的平均大小很小,请小心额外的费用。下面是我对这种危险写了一篇文章:
过渡S3对象的成本冰川
http://alestic.com/2012/12/s3-glacier-costs
如果仍想复制从S3到冰川,这里是与你的问题的一些点:
你大概会把数据留在冰川很长一段时间,所以压缩它可能是值得的短期CPU使用率。确切的折衷取决于诸如数据的可压缩性,压缩需要多长时间以及需要多长时间执行一次压缩等因素。
将数据从S3下载到EC2实例不收取任何费用。没有数据传输费用向Glacier上传数据。
如果您上传很多小文件到Glacier,则每件商品的上传费用可能会相加。您可以通过将许多小文件合并到档案并上传来节约成本。
另一个S3的功能,可帮助防止通过用户错误或攻击意外损失是打开S3版本并启用MFA(多因素认证)。这可以防止任何人能够永久删除对象,除非他们拥有凭据加上您拥有的物理设备。
我们终于厌倦了处理从冰川恢复的通常3-5小时的长延迟以及隐藏的成本因素。 我们最终创建了一个程序,用于同步和创建我的存储桶的快照,其中包括使用S3 Reduced Redundancy Storage来更好地接近Glacier的成本节约优势。 它在过去几年对我们很好,所以我们最终把它变成了一个商业产品。 您可以在[BucketBacker](https://www.bucketbacker.com/) – Krafty 2015-03-14 14:57:24