我有以下数据,其中每个客户购买多个类别的项目的所有交易。我需要找到甚至不共享一个类别的客户对。如何比较使用配置单元的套件
Customer_id category_id
21 3
21 5
31 4
31 1
24 3
24 6
22 6
22 5
我想先用collect_set,然后在一个交叉对比组加入,但我不知道在蜂巢任何这样的功能。是否有可能以更简单的方式做到这一点?我对数据输出上述应为(21,31),(31,24),(31,22),这是不共享任何category_ids
SELECT
customer_id, COLLECT_LIST(category_id) AS aggr_set
FROM
tablename
GROUP BY
customer_id