1
EMR和Scan都将解析整个表并消耗请求信用,但EMR也需要使用ec2实例,因此成本更高。何时使用EMR或扫描亚马逊的Dynamo-DB?
所以,我想知道在哪种情况下EMR比扫描亚马逊的Dynamo-DB更适合?
EMR和Scan都将解析整个表并消耗请求信用,但EMR也需要使用ec2实例,因此成本更高。何时使用EMR或扫描亚马逊的Dynamo-DB?
所以,我想知道在哪种情况下EMR比扫描亚马逊的Dynamo-DB更适合?
对不起 - 我不完全确定我理解你的问题。
如果您问为什么要使用EMR扫描整个DynamoDB表而不是直接执行扫描,则答案就是速度和简单性。
如果对DynamoDB Serde使用Hive之类的东西,则可以比直接查询DynamoDB更快地提取DynamoDB表的全部内容,因为扫描将进行并行处理。
DynamoDB支持一致的读取性能,因此在查询DynamoDB表时,通常会发现瓶颈转移到客户端能够以足够快的速度读取数据。