任何人在没有使用EMR的情况下使用DynamoDB和Hive？

但是根据该链接，Hive需要在EMR之上进行设置。但是我想知道是否可以使用与独立Hadoop集群的集成，而不是使用EMR。有没有人做过这个？与使用EMR相比，DynamoDB和HDFS中的数据会发生同步问题吗？

2012-04-18 Arvind

为了能够使用它自己的群集上，则需要自定义StorageHandler为DynamoDB（它可能包括一个定制SERDE为好）。

目前似乎不可用，至少在AWS网站上不可用。

你可以做的是使用亚马逊提供的JDBC interface从你的集群生成查询，但它仍然会在EMR之上执行。

2012-04-19 14:45:37

回答