2017-09-16 43 views

回答

0

您可以使用两个连接实现这一目标和union.Load这两个数据集关系A和B.创建一个新的关系C加入第一个条件ta = tab.w.创建另一个新的关系D加入第二个条件tb = tab.x.UNION C和D.假设所有的数据类型都是int。

A = LOAD 'data1.txt' USING PigStorage(',') AS (a:int,b:int,c:int,d:int); 
B = LOAD 'data2.txt' USING PigStorage(',') AS (w:int,x:int,y:int,z:int); 
C = JOIN A BY A.a,B BY B.w; 
D = JOIN A BY A.b,B BY B.x; 
E = UNION C,D; 
DUMP E;