我们希望在当前数据库之上使用Amazon Elastic MapReduce(我们在EC2上使用Cassandra)。纵观亚马逊EMR常见问题,它应该是可能的: Amazon EMR FAQ: Q: Can I load my data from the internet or somewhere other than Amazon S3?为Elastic MapReduce配置外部数据源
但是,创建一个新的工作流时,我们只能配置一个S3存储作为输入数据源。
任何想法/样品如何做到这一点?
谢谢!
P.S .:我见过这个问题How to use external data with Elastic MapReduce,但答案并没有真正解释如何做到/配置它,只是这是可能的。