我想要做一个简单的猪查询,我需要找到电影的平均评级为ID 178我已经尝试了一些版本的下面和过滤器工作,但没有AVG功能。任何人都可以建议吗?由于 a = load '/user/pig/u.data' AS (userid:int, movieid:int, rating:double, timestamp:chararray);
b = FOREACH a GENERATE AVG(rati
后加入和GROUP BY我在新的猪,并试图理解为什么我不能指望后加入和组: A = LOAD 'mary' as (line);
B = LOAD 'mary' as (line);
wordsA = foreach A generate flatten(TOKENIZE(line)) as wordA;
grpdA = group wordsA by wordA;
cntdA = fo
我想弄清楚下面的问题。 有多少女性用户提供了至少一个等级4.我认为我的连接和过滤器是正确的,但我无法弄清楚计数部分已经尝试了以下的众多版本。 a = load '/user/pig/movie' AS (userid:int, movieid:int, rating:int, timestamp:chararray);
b = load '/user/pig/reviewer' using Pi
我在下面 提到文件的数据美国美国欧洲欧洲美国 美国美国欧洲美国 EUROPE美国 我试图找出美国和欧洲的数量。 1) inp = LOAD '/user/countries.txt' as (singleline);
dump inp;
Output
(USA USA EUROPE EUROPE EUROPE EUROPE USA)
(USA USA EUROPE EUROPE USA