之间的关系,我有以下大熊猫据帧Top15
: 使用.corr得到两列
我创建估计每人可引用的文件数量列:
Top15['PopEst'] = Top15['Energy Supply']/Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents']/Top15['PopEst']
我想知道人均可接受文件数量与人均能源供应之间的关系。所以我用.corr()
方法(Pearson相关):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
我想回到一个单一的数字,但结果是:
谁能帮助我?
我认为你是对的。但是,你能告诉我为什么'data.corr(method ='pearson')'只返回能源供应和能源供应之间的关系吗? –
它没有。它应该返回给你一个2x2矩阵;你显示它的左上角。如果将'.corr'直接应用于数据框,它将返回所有成对相关;这就是为什么你在矩阵的对角线上观察1s(每列与自身完全相关)。看到我的编辑如下。 – Cleb
如果您认为它已回答您的问题,请考虑[接受](http://meta.stackexchange.com/a/5235) – MaxU