2017-07-19 321 views
0

随着时间的推移,我有数百个种群(不同物种,地点等)的相关性。我如何统计分析所有这些相关性(各自的组)?比较R中的许多相关性

我有p值,配置文件,相关系数为每600 +相关,但我怎么能比较这些组内(物种,位置等)。

我试图在数据相关人口数(百分比)和年份,物种和位置(变成虚拟变量)上进行大的部分相关性作为控制因素,当家庭内部以及与位置相关时(作为虚拟变量)作为一个控制变量时关联物种内,但我不知道这是否正确。

下面是一些示例数据,但这是一个更后勤问题,反对以实际数据的问题:

Location Species     Year Section Total Percent Family 
Chiswell A Black-legged Kittiwake 1976 Central 310 16.78397401 Gull 
Chiswell A Black-legged Kittiwake 1986 Central 982 53.16729832 Gull 
Chiswell A Black-legged Kittiwake 1989 Central 555 30.04872767 Gull 
Chiswell B Common Murre   1976 Central 150 20.6043956 Auk 
Chiswell B Common Murre   1986 Central 385 52.88461538 Auk 
Chiswell B Common Murre   1991 Central 193 26.51098901 Auk 
Natoa Is Black-legged Kittiwake 1976 Central 70 12.77372263 Gull 
Natoa Is Black-legged Kittiwake 1986 Central 168 30.65693431 Gull 
Natoa Is Black-legged Kittiwake 1989 Central 310 56.56934307 Gull 
Wooded Is Black-legged Kittiwake 1972 Central 1560 13.35159192 Gull 
Wooded Is Pelagic Cormorant  1972 Central 144 45.56962025 Cormorant 
Wooded Is Black-legged Kittiwake 1976 Central 2350 20.11297501 Gull 
Wooded Is Glaucous-winged Gull 1976 Central 150 13.83763838 Gull 
Wooded Is Horned Puffin   1976 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  1976 Central 44 13.92405063 Cormorant 
Wooded Is Pigeon Guillemot  1976 Central 100 37.59398496 Auk 
Wooded Is Red-faced Cormorant  1976 Central 4 66.66666667 Cormorant 
Wooded Is Tufted Puffin   1976 Central 9600 98.21976673 Auk 
Wooded Is Black-legged Kittiwake 2000 Central 5587 47.81752824 Gull 
Wooded Is Glaucous-winged Gull 2000 Central 472 43.54243542 Gull 
Wooded Is Horned Puffin   2000 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  2000 Central 64 20.25316456 Cormorant 
Wooded Is Pigeon Guillemot  2000 Central 83 31.20300752 Auk 
Wooded Is Red-faced Cormorant  2000 Central 1 16.66666667 Cormorant 
Wooded Is Tufted Puffin   2000 Central 87 0.890116636 Auk 
Wooded Is Black-legged Kittiwake 2001 Central 2187 18.71790483 Gull 
Wooded Is Glaucous-winged Gull 2001 Central 462 42.6199262 Gull 
Wooded Is Horned Puffin   2001 Central 30 33.33333333 Auk 
Wooded Is Pelagic Cormorant  2001 Central 64 20.25316456 Cormorant 
Wooded Is Pigeon Guillemot  2001 Central 83 31.20300752 Auk 
Wooded Is Red-faced Cormorant  2001 Central 1 16.66666667 Cormorant 
Wooded Is Tufted Puffin   2001 Central 87 0.890116636 Auk 

任何建议表示赞赏,谢谢!

+0

我不确定你想要的输出是什么。也许是一个示例表? – pyll

+0

@pyll我希望的输出将是一个科或科内的物种的“综合”相关性。我已经与百分比和年份的物种子集(即簇绒海雀)进行了关联,但是这并没有考虑位置,因此尽管我在整个采样区域都有该物种的corcoeff,p值等,我不认为这在统计上是正确的。 – LearningTheMacros

回答

0

这超出了堆栈溢出问题的范围,应该可能发布在面向更多统计的论坛中。

但是,我会查看vegan包,并专门查看规范对应分析或主成分分析。排序方法可以让您减少维度并查看许多不同分组变量之间的重要/有用的相关性。

Vegan

更新

随着时间序列作为模型的变量之一,这将是正确的统计,以确定是否有通过时间相关的重复集合效应。多维方差分析在确定变量之间的相关性方面可能比在排序方法中找到多组点更有用。

+0

我同意,但与其他统计论坛相比,堆栈溢出中的流量更多。 NMDS分析之前我曾在素食主义者工作过。但我不确定这是否适用于此,我会再次检查它。 – LearningTheMacros

+0

NMDS是相当有限的IMO,但你可以使用另一个排序方法来理解重要的分组变量。作为另一种方法,对于所有分组变量,您可以始终使用准泊松分布计数数据创建一般线性,并使用f检验从p值确定显着性。 –

+0

我试过GLM,但我不认为这是我要找的。我也不确定是否PCA或CCA是我正在寻找的。基本上,我只是试图了解在一个大的地理区域内不同人群的物种是否随着时间的推移而发生了变化,但是我不知道怎么做,除了执行600次相关性之外,我已经做了。我想我可以只显示每个物种的种群百分比在下降/增加,这是否会在统计上有效? 有没有更全面的方法? – LearningTheMacros