0
我有一个看似非常简单的问题,但我似乎无法弄清楚。Piglatin找到一列是否包含另一列的内容
我有一个看起来像这样的数据:
A (B, C, A)
B (X, Y, Z)
C (F, C, D)
我使用的Pig Latin检查,如果在第一列中的文字出现在第二列。
这是我的代码现在:
Labels = LOAD 'example.txt' USING PigStorage('\t');
Projected = FOREACH Labels GENERATE $0 AS id, $1 AS group;
X = FILTER Projected BY (group matches '.*(chararray)id.*');
STORE X INTO '/test' USING PigStorage(',');
我期待的输出为:“*”
A (B, C, A)
C (F, C, D)
我也试过串接的ID,但它是无济于事。
我一直坚持与此相当一段时间,任何帮助将不胜感激。谢谢!
非常感谢!这有帮助。 :) – Karen 2013-04-22 07:53:36