2017-02-09 116 views
0

我有一个熊猫数据帧像这样:在Python中如何做多列比2个多变量之间的相关性?

id cat1 cat2 cat3 num1 num2 
1  0  WN  29  2003 98 
2  1  TX  12  755  76 
3  0  WY  11  845  32 
4  1  IL  19  935  46 

我想找出CAT1和列CAT3,NUM1与NUM2 或CAT1和NUM1与NUM2 或CAT2和CAT1,CAT3之间的相关性, NUM1,NUM2

当我使用df.corr()它给出了数据帧中的所有列之间的相关性,但我想看看上面详述只是这些选择性列之间的相关性。

我如何做到这一点在Python熊猫吗?

千预先感谢您的回答。

+1

'DF [[ 'CAT1', 'CAT3']]。科尔()',等 – DyZ

回答

2

我尝试了以下内容和它的工作:

features1=list(['cat1','cat2','cat3']) 
features2=list(['Cat1', 'Cat2','num1','num2']) 
df[[features1]].corr() 
df[[features2]].corr() 

好方法来选择根据需要的列时,你有你的数据集非常高的变量。

相关问题