2016-02-27 63 views
0

我正在使用AWS Data Pipeline中的配置单元脚本将数据从DynamoDB传输到S3。我使用的是这样的脚本:如何使用配置单元脚本访问dynamoDb中blob的个人元素?

创建存储BY “org.apache.hadoop外部表dynamodb_table(属性STRING,EMAIL STRING,.............)。 hive.dynamodb.DynamoDBStorageHandler'TBLPROPERTIES (“dynamodb.table.name”=“$ {DYNAMODB_INPUT_TABLE}”, “dynamodb.column.mapping”= “PROPERTIES:Properties,EMAIL:EmailId ....”); CREATE EXTERNAL TABLE s3_table( PROPERTIES STRING, EMAIL STRING, ...... )

行格式分隔字段TERMINATED BY TERMINATED BY '\ n'

LOCATION' '\ T' LINES $ {S3_OUTPUT_BUCKET}“;

INSERT OVERWRITE TABLE s3_table SELECT * FROM dynamodb_table;

在DyanmoDB表中的属性栏是这样

属性:字符串 :{\ “协议\”:空,\ “MinType \”:空,\ “打折\”:空}

它是它包含多个属性。我希望属性中的每个属性都作为一个单独的列(不只是单个列中的一个字符串)。我想在此架构

输出交易MinType折扣EMAIL

我怎样才能做到这一点?

回答