2014-02-24 59 views
1

我们正在尝试使用Pig query来过滤hdfs数据。我们将数据包含在双引号内。例如:“AAA”,“BBB”,“YYY”。其中我们试图过滤YYY 我们尝试了以下过滤方式,过滤器无法正常工作

FILTER a BY XXX == 'YYY'; 
FILTER a BY XXX == '.*YYY.*'; 
FILTER a BY XXX == '\'\YYY\"\'; 

期待您的帮助。

回答

2

看起来你要使用正则表达式。在那种情况下,你有一些问题。您需要使用MATCHES而非==,您必须将整个字符串,而不只是一个子串匹配,并使用元字符的时候,你必须转义反斜线,与任何Java字符串:\\d用来匹配一个数字,不\d