这里删除的元组是我的代码,为我的问题:猪拉丁语中的数据包
a = LOAD 'tellers' using TextLoader() AS line;
# convert a to charrarry
b = foreach a generate (chararray)line;
# run through my UDF to create tuples
c = foreach b generate myudfs.TellerParser5(line); # ({(20),(5),(5),(10)(1),(1),(1),(1),(1),(5),(10),(10),(10)})....
d = foreach c generate flatten(number);
e = group d by number; #{group: chararray,d: {(number: chararray)}}
f = foreach e generate group, COUNT(d); # f: {group: chararray,long}
在databag女,我有一个空的元组(1)我想过滤/删除。
dump f;
(,1)
(1,97)
(5,49)
(10,87)
(20,24)
describe f;
f: {group: chararray,long}
我已经试过这没有成功(不作任何改变):
remove_tuple = filter f BY group is not null;
如何更改元组名称?为什么它是“组”是我创建数据包“e”的方式。所以上面为我编辑的代码。 – jKraut
在第一个脚本本身中更改“e”并尝试..... U不应该在任何地方使用关键字作为元组名称.... – madhu