看来,对于大N(比如2e6)在Hmisc包cut2函数抛出一个错误 y = cut2(rnorm(2000000,0,1),m=sqrt(2000000))
Error in if (cj == upper) next : missing value where TRUE/FALSE needed
In addition: Warning message:
In (1:g) * nnm :
我有一个看起来像这样的数据保存为新的变量: id <- c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5,6,6,6,7,7,7,8,8,8,9,9,9)
yr <- c(1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3)
gr <- c(3,4,5,3,4,5,3,4,5,4,5,6,4,5,6,4,5,6,5,6,7,
我有一年的数据框(2006年至2010年),4个行业部门,150个公司名称和这些公司的净收入。总共有750个观察值,每个企业每年有一个观察值。我想根据五分制在每个行业年度内为企业的收入分数。因此,每个行业年度收入在前20%的公司得分为5分,接下来的20%得分为4分,依此类推。底部20%的分数为1 样本数据的基础是: Year Industry Firm Income
2006 Chemicals