2016-10-03 73 views
0

我努力学习的Hadoop /猪和一直在AWS,过滤通过的Hadoop /猪匹配

日期看起来像这样(每列都含有不同的网站):

<http://openean.kaufkauf.net/id/businessentities/GLN_7654990000088> 
<http://www.w3.org/2000/01/rdf-schema#isDefinedBy> 
<http://openean.kaufkauf.net/id/businessentities/> 
<http://openean.kaufkauf.net/id/businessentities/GLN_6406510000068> . 

我试图筛选其中包含“业务”的行,但筛选器一直返回0条记录。 my_data的格式与上面的3列一样,第一列是上面显示的主题,以及我想要过滤的内容。我有:

filter1 = FILTER my_data BY subject=='.*business.*'; 

不知道为什么这不会返回任何“商业”肯定是在3记录。

回答

3

试试这个

filter1 = FILTER my_data BY (subject matches '.* business.*'); 
+0

非常感谢,这作品! –

+0

NP,请接受答案并进行投票。 –