我们正在研究创建于AWS数据湖的解决方案 - 类似于在这里概述 - https://aws.amazon.com/blogs/big-data/introducing-the-data-lake-solution-on-aws/ETL VS ELT亚马逊红移
我们将存储在S3中所有的“原始”数据,并将其加载到EMR或根据需要进行红移。
在这个阶段,我找对是否使用ETL或ELT方法将数据加载到亚马逊红移建议。我们将使用Talend进行ETL/ELT。
我们应该首先将其转化还是应该在S3转换数据并将其装载到红移前阶段红移“原始”从S3的数据?
我将不胜感激任何建议/建议。
谢谢。