我有一个数据帧df
,看起来像这样:拆分数据框随机(依赖于唯一值)
| A | B | ... |
---------------------
| one | ... | ... |
| one | ... | ... |
| one | ... | ... |
| two | ... | ... |
| three | ... | ... |
| three | ... | ... |
| four | ... | ... |
| five | ... | ... |
| five | ... | ... |
正如你可以看到A
有5个独特的价值。我想随机分割DataFrame。例如,我想在DataFrame df1
中使用3个唯一值,并在DataFrame df2
中使用2个唯一值。我的问题是他们不是独一无二的。我不想通过两个DataFrame分割这些独特的值。
所以导致数据框看起来是这样的:
数据帧df1
与3个独特的价值观:
| A | B | ... |
---------------------
| one | ... | ... |
| one | ... | ... |
| one | ... | ... |
| three | ... | ... |
| three | ... | ... |
| five | ... | ... |
| five | ... | ... |
数据帧df2
2个独特的价值观:
| A | B | ... |
---------------------
| two | ... | ... |
| four | ... | ... |
反正是有如何轻松实现这一点?我想到了分组,但我不知道如何从这个斯普利特...
你将有独特的一个因素提取到一个列表,然后拆分此列表分为2所列出,然后选择您的基于2个列表的数据帧。 –