大问题: 我想要一个数据框中两个字段之间的唯一组合列表。awk从2列删除镜像副本
示例数据:
A B
C D
E F
B A
C F
E F
我希望能够得到的4种独特的组合结果:AB,CD,EF,和CF.由于BA和和BA含有相同的成分,但以不同的顺序,我只想要一个副本(它是如此BA相互关系是一回事AB)
尝试:
到目前为止,我已经尝试排序,并保持独特行:
sort file | uniq
当然能产生5种组合,但:
A B
C D
E F
B A
C F
我不知道如何处理AB/BA被认为是一样的。有关如何做到这一点的任何建议?
是否真实数据只有两个字符,也可以是两个以上的? –
@George对不起,我没有指定 - 真正的数据是每列多个字符,但詹姆斯和埃德提供了适用于多个字符的答案 – user4670961
我建议包括一个多字符样本输入/期望输出;是可能的一些解决方案打破多个字符... –