2012-07-16 81 views

回答

2

对不起 - 我不完全确定我理解你的问题。

如果您问为什么要使用EMR扫描整个DynamoDB表而不是直接执行扫描,则答案就是速度和简单性。

如果对DynamoDB Serde使用Hive之类的东西,则可以比直接查询DynamoDB更快地提取DynamoDB表的全部内容,因为扫描将进行并行处理。

DynamoDB支持一致的读取性能,因此在查询DynamoDB表时,通常会发现瓶颈转移到客户端能够以足够快的速度读取数据。