quantile

    1热度

    1回答

    看来,对于大N(比如2e6)在Hmisc包cut2函数抛出一个错误 y = cut2(rnorm(2000000,0,1),m=sqrt(2000000)) Error in if (cj == upper) next : missing value where TRUE/FALSE needed In addition: Warning message: In (1:g) * nnm :

    0热度

    1回答

    我有一个看起来像这样的数据保存为新的变量: id <- c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5,6,6,6,7,7,7,8,8,8,9,9,9) yr <- c(1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3) gr <- c(3,4,5,3,4,5,3,4,5,4,5,6,4,5,6,4,5,6,5,6,7,

    -1热度

    1回答

    我正在努力了解如何在Python中分拣数据。到目前为止,我已经制定了如何使用边缘: edges = pylab.hist(data, bins=10)[1] 我不确定这是否是最理想的方法,但它的工作!给我一个11个数字的列表,用于制作10个垃圾箱。问题在于如何将数据分类到垃圾箱中,我感到茫然。我试着使用: digitized = np.digitize(data, edges) 但是,这只

    1热度

    1回答

    数据的完整高斯拟合获​​得位数我一直在努力为R如何计算位数和数据的正常安装。 我有截断正态分布后的数据(见图) 我有兴趣从数据和拟合正态分布曲线得到最低的第10百分点值(p = 0.1)。 在我的理解,因为数据被截断,这两个应该是完全不同的:我希望从数据中位数比从正常的分布计算的一个更高的,但事实并非如此。对于我所理解的位数功能的帮助从数据中位数应该是默认位数功能: q=quantile(y, p

    2热度

    1回答

    我有一年的数据框(2006年至2010年),4个行业部门,150个公司名称和这些公司的净收入。总共有750个观察值,每个企业每年有一个观察值。我想根据五分制在每个行业年度内为企业的收入分数。因此,每个行业年度收入在前20%的公司得分为5分,接下来的20%得分为4分,依此类推。底部20%的分数为1 样本数据的基础是: Year Industry Firm Income 2006 Chemicals

    1热度

    2回答

    我试图拟合数据集中一个变量的每个四分位数的生存模型。以可用弓步癌症的数据集survival包为例 library(survival) datalung <- lung attach(datalung) fit<- survfit(Surv(time,status) ~ quantile(age)[2:5],type = "kaplan-meier") 但我得到一个错误约长的变量是不同的。

    1热度

    1回答

    我有一个含数字的一维numpy数组,我希望每个数字都替换为它所属的分位数索引。 这是我的五分之一人口指数代码: import numpy as np def get_quintile_indices(a): result = np.ones(a.shape[ 0 ]) * 4 quintiles = [ np.percentile(a, 20),

    0热度

    1回答

    我正在使用Stata和调查可变家庭净财富NetWealth)。 我要构建这个变量的五分之一,并使用下面的命令 - 你可以看到我使用的调查数据,因此申请调查权: xtile Quintile = NetWealth [pw=surveyweight], nq(5) 然后我给下面的命令来检查什么我已获得: tab Quintile, sum(NetWealth) 这是结果: Means, S

    1热度

    1回答

    目前垂直线,我可以创造一个情节像这样: geom_bar ggplot(df.Acc, aes(x = reorder(cities, -accidents), y = accidents)) + geom_bar(stat = "identity", fill="steelblue", alpha=0.75) + geom_hline(yintercept=0, size=0.4, colo

    0热度

    1回答

    工作我使用quantile采取用户指定的变量的百分在闪亮应用我在写有任何问题,并且使用这些百分比值设置为一个在x限制直方图输出。 我已经尝试了一堆修复建议在相关问题的答案,但不断收到有关反应性,变量类型和NA(即使我有na.rm = TRUE)的不同错误。 这个例子是从一个更复杂的应用程序削减,所以我不能显示我已经试过的一切,但我很确定问题发生在quantile命令,并且可能有几个不同的问题我的代