2017-04-04 60 views
0

您的建议对我的项目将有很大的帮助。Amazon Glacier - 根据前缀检索文件

计划使用亚马逊冰川来存储cron作业的输出以进行长期存储。 cron作业产量将每天&上生成的每个文件将在这下面的名称格式

03-04-2017-output-1.txt 
03-04-2017-output-2.txt 
04-04-2017-output-1.txt 
04-04-2017-output-2.txt 

是否有可能检索单个文件,该文件是文件的使用日期前缀的整合? 例如,我想检索在03-04-2017生成的文件,因此一个包含03-04-2017-output-1.txt,03-04-2017-output-2.txt的zip文件是否可能根据文件名选择文件并检索?

我访问了AWS amazon glacier的文档,了解了基于MB的关于范围检索,是否可以根据文件名进行检索?

+1

除非您确定自己在做什么,否则请勿使用冰箱。 看看你如何检索文件的方式,我敢打赌,你真的不知道冰川背后隐藏的成本。估算您的存储需求,然后阅读标准和IA的S3定价。 很高兴学习其他人的“课程”,如在这里展示 - > https://medium.com/@karppinen/how-i-ended-up-paying-150-for-a-single-60gb-download-从亚马逊冰川-6cb77b288c3e – mootmoot

+0

嗨@mootmoot,感谢您的警告..将牢记亚马逊冰川上传和下载费用..但我们仍然选择冰川长期存储,而不是频繁访问..只是想知道在检索时基于文件名合并文件的这种模式是否可行? – DPK

回答

0

您已经提到了zip文件中的文件存储,它与所有存储服务无关,因为挖掘ZIP内容会浪费CPU资源和高风险实践(例如归档弹/压缩炸弹)。

所以你需要直接处理存储的对象。

恕我直言,你最好的选择是创建你的S3 storage inventory。只要你确保你的压缩日志文件被赋予适当的日期/等索引前缀/后缀。如果您想将中期内容存储在S3标准和标准IA存储器中,这也很有用。

正如AWS Glacier FAQ

Q提到:我可以看到我的档案储存在亚马逊的冰川?

是的。尽管您需要维护自己的数据索引,但您需要将 上传到Amazon Glacier,但您的每个 电子仓库中的所有归档清单都会保留用于灾难恢复或偶尔会使用 对帐。库存库每天更新约 。您可以将文件库清单作为JSON或CSV文件请求,并将包含有关文件库 中归档文件的详细信息,包括文件大小,创建日期和归档说明(如果您在上传过程中提供了 ,则为 )。库存将代表最近库存更新时库的状态 。