2017-03-08 36 views
-1

我有一个数据,包括不同的类型:如何找到一个混合数据的相关性,包括在R连拍,类别和日期类型

a <- data.frame(x=c("a","b","b","c","c","c","d","d","e","f"),y=c(1,2,2,2,3,1,4,7,10,2),m=c("a","d","ab","ac","ac","vc","ed","ed","e","df"),n=c(2,1,5,3,3,2,8,10,10,1)) 

实际上,该数据比这更复杂,可能包括日期,以及。此外,这是一个无人监督的问题。所以这里没有“班级标签”。所以我不能使用方差分析等方法。那么,我怎么能找到每两列之间的相关性?

P.S.我在psych package中找到一个名为mixed.cor的函数,但无法理解如何使用它。

此外,相关性仅表示线性关系。如果我想知道每一列的重要性,我应该使用什么函数?

回答

2

对于分类数据,未定义大多数人用于数字变量(即Pearson相关)的相关度量。如果您想测量数值变量和分类变量之间的关联,则可以使用方差分析。如果您想测量两个分类变量之间的关联,则可以使用卡方检验。如果您的分类变量是有序的(例如低,中,高),则可以使用Spearman等级相关性。

+0

非常感谢。这有很大帮助。 –

相关问题