0
从Avro文件创建地板文件。现在我需要在Pig中加载Parquet文件。以下是我从parquet-tools schema
命令获得的架构。在Pig中加载嵌套Parquet文件?
message Logs {
optional group SUPER1 {
optional group FIELD1 (LIST) {
repeated int32 array;
}
optional group FIELD2 (LIST) {
repeated int32 array;
}
}
optional group SUPER2 {
optional int32 FIELD1;
optional binary FIELD2 (UTF8);
optional double FIELD3;
optional int32 FIELD4;
optional double FIELD5;
optional binary FIELD6 (UTF8);
}
optional group SUPER3 {
required int32 FIELD1;
required int32 FIELD2;
optional binary FIELD3 (UTF8);
optional binary FIELD4 (UTF8);
}
required binary SUPER4 (UTF8);
optional binary SUPER5 (UTF8);
}
现在我无法理解加载此文件的等效pig模式。我正在使用parquet.pig.ParquetLoader
。我做了以下转变: -
- 阵列将被加载
chararray
- 如何加载嵌套数据? bid_info.creative_id不工作:
mismatched input '.' expecting RIGHT_PAREN
- 我正在加载所有字段,无论是否可选。 Pig中的可选值应该加载为null。
我用简单的加载,没有任何明确的方案也试图然后我得到这个错误:
Failed to parse: Invalid list type optional group FIELD1 (LIST) {
repeated int32 array;
}