1
我们正在尝试使用Pig query来过滤hdfs数据。我们将数据包含在双引号内。例如:“AAA”,“BBB”,“YYY”。其中我们试图过滤YYY 我们尝试了以下过滤方式,过滤器无法正常工作
FILTER a BY XXX == 'YYY';
FILTER a BY XXX == '.*YYY.*';
FILTER a BY XXX == '\'\YYY\"\';
期待您的帮助。
我们正在尝试使用Pig query来过滤hdfs数据。我们将数据包含在双引号内。例如:“AAA”,“BBB”,“YYY”。其中我们试图过滤YYY 我们尝试了以下过滤方式,过滤器无法正常工作
FILTER a BY XXX == 'YYY';
FILTER a BY XXX == '.*YYY.*';
FILTER a BY XXX == '\'\YYY\"\';
期待您的帮助。
看起来你要使用正则表达式。在那种情况下,你有一些问题。您需要使用MATCHES
而非==
,您必须将整个字符串,而不只是一个子串匹配,并使用元字符的时候,你必须转义反斜线,与任何Java字符串:\\d
用来匹配一个数字,不\d
。