2012-04-18 41 views
2

我正在阅读使用Hive在DynamoDB上查询数据的以下集成。 http://aws.typepad.com/aws/2012/01/aws-howto-using-amazon-elastic-mapreduce-with-dynamodb.html任何人在没有使用EMR的情况下使用DynamoDB和Hive?

但是根据该链接,Hive需要在EMR之上进行设置。但是我想知道是否可以使用与独立Hadoop集群的集成,而不是使用EMR。有没有人做过这个?与使用EMR相比,DynamoDB和HDFS中的数据会发生同步问题吗?

回答

0

为了能够使用它自己的群集上,则需要自定义StorageHandler为DynamoDB(它可能包括一个定制SERDE为好)。

目前似乎不可用,至少在AWS网站上不可用。

你可以做的是使用亚马逊提供的JDBC interface从你的集群生成查询,但它仍然会在EMR之上执行。

相关问题