2017-08-03 93 views
-1

我有用重复值分隔的列(字符串)空间。我想删除重复项: 如何从配置单元表中删除字符串列中的重复项

column_name 
----------------- 
gun gun man gun man 
shuttle enemy enemy run 
hit chase 

我想导致这样的:

column_name 
---------------- 
gun man 
shuttle enemy run 
hit chase 

我使用蜂巢database.Please帮助。

+0

的可能的复制[如何删除蜂巢串的重复?(https://stackoverflow.com/questions/42874823/how-to-remove-duplicates-in-hive-string) –

回答

-1

没有自定义的UDF,这是一个只有查询的方法。

select id, concat_ws(' ',collect_set(splited)) as column_name 
from 
(
    select id, splited 
    from tbl_name 
    LATERAL VIEW explode(split(column_name,' ')) t as splited 
    group by id, splited 
) x 
group by id 
+0

非常感谢你许多。它正在工作 – Camel