我有一个名为data
文件看起来像这样:Apache的猪不能解析的元组完全
personA (1, 2, 3)
personB (2, 1, 34)
(注意,是“PERSONA”之后的制表),我有这样一个Apache猪脚本:
A = LOAD 'data' AS (name: chararray, nodes: tuple(a:int, b:int, c:int));
C = foreach A generate nodes.$0;
dump C;
输出其中有意义的:
(1)
(2)
但是如果我改剧本的模式是这样的:
A = LOAD 'data' AS (name: chararray, nodes: tuple());
C = foreach A generate nodes.$0;
dump C;
然后输出我得到的是这样的:
(1, 2, 3)
(2, 1, 34)
它看起来像该元组中的第一个(也是唯一一个)元素是一个字节阵列。即它不会将输入文本1, 2, 3
解析为元组。
未来我的输入将有一个未知的&变量数nodes
项中的元素,所以我不能只写出a:int, …
。
无论如何让Pig将输入元组解析为一个元组而不必写出完整的模式?