2017-04-26 92 views
1

在得到分析结果后,我正在进行主成分分析,如何识别第一对主要预测指标?因为情节很混乱。很难看到预测结果的名称:
enter image description here在R中识别来自Biplot的主成分

PCA结果的哪个部分应该查看?这更像是如何确定可以解释的最重要的预测变量,让我们说80%的数据变化。我们知道,例如前5个部分是这样做的,而主要部分只是预测变量的组合。如何识别那些“重要”预测指标。

+1

请在提问时提供可复制的示例。用于运行pca的代码更重要的是双触发​​生成的。另外,请定义“第一对原则预测变量”的含义。 –

+0

@Adam Quek,这更像是如何确定可以解释的最重要的预测变量,让我们说80%的数据变化。我们知道,例如,前5个组件就是这样做的。而主要组成部分只是预测变量的组合。如何识别那些“重要”预测指标。明白了吗? –

回答

1

看到这个答案Principal Components Analysis - how to get the contribution (%) of each parameter to a Prin.Comp.?

的信息存储在您的pca结果中。 如果您使用prcomp(),那么$rotation就是您所使用的,或者如果您使用princomp(),那么$loadings就是关键。例如,

require(graphics) 
data("USArrests") 

pca_1<-prcomp(USArrests, scale = TRUE) 
load_1<-with(pca_1,unclass(rotation)) 
aload_1<-abs(load_1) 
sweep(aload_1, 2, colSums(aload_1), "/") 
#    PC1  PC2  PC3  PC4 
#Murder 0.2761363 0.2540139 0.1890303 0.40186493 
#Assault 0.3005008 0.1141873 0.1485443 0.46016113 
#UrbanPop 0.1433452 0.5301651 0.2094067 0.08286886 
#Rape  0.2800177 0.1016337 0.4530187 0.05510509 


pca_2<-princomp(USArrests,cor=T) 
load_2<-with(pca_2,unclass(loadings)) 
aload_2<-abs(load_2) 
sweep(aload_2, 2, colSums(aload_2), "/") 

#   Comp.1 Comp.2 Comp.3  Comp.4 
#Murder 0.2761363 0.2540139 0.1890303 0.40186493 
#Assault 0.3005008 0.1141873 0.1485443 0.46016113 
#UrbanPop 0.1433452 0.5301651 0.2094067 0.08286886 
#Rape  0.2800177 0.1016337 0.4530187 0.05510509 

正如你所看到的,MurderAssaultRape各出资约30%至PC1,而UrbanPop不仅有助于〜14%,至PC1,又是主要贡献者PC2(〜53%)。

+0

@ j-con我有一个相对较大的数据集,包含200个长格式主题的几个心理评分,给我20000个数据集条目。我想通过使用PCA来降低这个数据集的维度,你会怎么建议我去做?谢谢。 –

+0

这是一个非常棒的分步教程。 https://media.readthedocs.org/pdf/little-book-of-r-for-multivariate-analysis/latest/little-book-of-r-for-multivariate-analysis.pdf。让我知道如果你卡住 –

+0

你很美妙,谢谢! –