将文件从s3复制到红移需要很长时间

我正在使用AWS到COPY从我的S3存储桶到我的Redshift群集中的表的日志文件。每个文件大约有100MB，我没有'gziped'。我现在有600个这样的文件，并且仍在增长。我的群集有2个dc1.large计算节点和一个领导节点。将文件从s3复制到红移需要很长时间

问题是，COPY手术时间过大，至少40分钟。加速它的最佳方法是什么？

1）获得更多节点ou是一个更好的节点机器？ 2）如果我gzip的文件，它会真的很重要的方面COPY手术时间增益？

3）这里有一些设计模式有帮助吗？

罗德里戈，

下面是正确答案：

1 - 有可能是一些优化你改变你的硬件设置，然后才能做。你必须进行测试，但确保完成所有优化之后，如果仍然需要更好的性能，我会建议使用更多的节点。

2 - Gzipped文件可能会提高性能。但我怀疑还有其他优化需要先做。见红移文档这一建议：http://docs.aws.amazon.com/redshift/latest/dg/c_best-practices-compress-data-files.html

3 - 下面是你应该看看按重要性顺序的事情：

即使在双节点群集中，我预计60GB的负载也会比您看到的更快。检查这6个项目，让我们知道。

感谢

@BigDataKid

2016-08-16 20:56:33 BigDataKid

，谢谢，我会尽量回来的结果。 –

花了20分钟4节点和gziped文件。 –

回答