我想要通过多个变量对数据集进行分组,而不是对这些组进行编号。当我只用一个变量对group_indices使用dplyr进行分组时,我可以使用id组。 但我想通过对至少一个变量集中的至少一个赋值相同的值来对案例进行分组,然后确定属于的组案例。如何在R中做到这一点?在R中至少有三个共同变量的例子
我有以下数据集
NPI name adress phone
1 1 1 1
2 1 1 1
3 2 2 2
4 2 3 3
5 3 4 4
6 3 4 5
7 4 5 6
8 5 6 6
9 6 7 7
10 7 8 8
11 1 9 9
我想,当他们有共同的三个I上市(姓名,ADRESS,PHONENUMBER)中的至少一个变量来进行分组的情况。 对于彼此具有最多共同点的案例,应该将它们分组在共同点最少的案例中。 所以我想创建一个分组变量,如果它们在同一个组中,它将给出相同的值。 你可以假设名称>地址的层次>手机
NPI name adress phone org
1 1 1 1 1
2 1 1 1 1
3 2 2 2 2
4 2 3 3 2
5 3 4 4 3
6 3 4 5 3
7 4 5 6 4
8 5 6 6 4
9 6 7 7 5
10 7 8 8 6
11 1 9 9 1
在我的真实数据集,我没有数字,但姓名,实际地址和电话号码。所以我正在使用的所有变量都是字符串变量。
为什么是最后一个值1 – akrun
因为它的股票名称与前两种情况 –
我们是否可以假设一个层次(看起来暗示)。如:姓名>地址>组织? – jacobsg