我正在使用AWS Data Pipeline中的配置单元脚本将数据从DynamoDB传输到S3。我使用的是这样的脚本:如何使用配置单元脚本访问dynamoDb中blob的个人元素?
创建存储BY “org.apache.hadoop外部表dynamodb_table(属性STRING,EMAIL STRING,.............)。 hive.dynamodb.DynamoDBStorageHandler'TBLPROPERTIES (“dynamodb.table.name”=“$ {DYNAMODB_INPUT_TABLE}”, “dynamodb.column.mapping”= “PROPERTIES:Properties,EMAIL:EmailId ....”); CREATE EXTERNAL TABLE s3_table( PROPERTIES STRING, EMAIL STRING, ...... )
行格式分隔字段TERMINATED BY TERMINATED BY '\ n'
LOCATION' '\ T' LINES $ {S3_OUTPUT_BUCKET}“;
INSERT OVERWRITE TABLE s3_table SELECT * FROM dynamodb_table;
在DyanmoDB表中的属性栏是这样
属性:字符串 :{\ “协议\”:空,\ “MinType \”:空,\ “打折\”:空}
它是它包含多个属性。我希望属性中的每个属性都作为一个单独的列(不只是单个列中的一个字符串)。我想在此架构
输出交易MinType折扣EMAIL
我怎样才能做到这一点?