在Redshift FAQ下为什么Redshift不需要物化视图或索引?
问:如何亚马逊红移的效果进行比较,数据仓库和分析最传统的数据库?
它说以下内容:
高级压缩:柱状数据存储可以比基于行的数据存储,因为类似的数据存储在磁盘上依次被压缩得多。 Amazon Redshift采用多种压缩技术,通常可以实现相对于传统关系数据存储的显着压缩。此外,Amazon Redshift不需要索引或物化视图,因此比传统关系数据库系统使用更少的空间。将数据加载到空表时,Amazon Redshift会自动对您的数据进行采样并选择最合适的压缩方案。
为什么会出现这种情况?
如果我手动在redshift中创建实例化视图,我应该只是在一段时间内创建和删除表? – m0meni
@ AR7 - 这取决于你。我们处理多TB数据集。重建整张桌子至少可以说是惩罚性的。 RedShift的UPDATE行为是软删除记录(直到VACUUM)并将新数据插入表的未分类部分。因此,我们只需删除任何已更改或已删除的内容,然后插入已更改或新增的内容。然后在维护阶段处理VACUUM和ANALYZE。重新构建会避免未排序的块,并且本身比VACUUM更快。这是一种折衷。 – MatBailie
您是否有推荐使用红移的资源?我对使用它很新,而且目前这里没有那么多的数据,但它肯定会增长,我宁愿不准备。我不太了解真空吸尘器或红移的最佳做法,除了亚马逊在他们的文档中有更多的信息,了解更多信息会更好。 – m0meni