2013-04-16 32 views
0

假设我的数据是这样的一个名为食品列,行动和人口:我怎么能写的Pig Latin脚本只产生一个独特的饮食&行动猪不同原子

pizzas eatenBy humans 
pizzas eatenBy collegeKids 
pizzas eatenBy everyOne 
pizzas grownBy farmers 
sprouts grownBy sproutFarmers 
sprouts grownBy humans 

,任何有效的人口从不同的食物&行动组?

即,我会从上述数据唯一喜欢的输出会是这样(虽然第一和第三线的人口可能会有所不同):

pizzas eatenBy everyOne 
pizzas grownBy farmers 
sprouts grownBy sproutFarmers 

谢谢

回答

1

唐不知道你如何用DISTINCT(这比我提出的建议更有效)做到这一点,但你可以这样做:

food = load 'foodInput' AS (foodType,action,population); 
foodGrouped = GROUP food by (foodType,action); 
foodLimited = foreach foodGrouped { 
    limited = LIMIT food 1; 
    GENERATE FLATTEN(limited.(foodType,action,population)); 
}; 
+0

不能做到这一点,因为选择第三字段不清楚 – Rags