quantile

1热度

1回答

看来，对于大N（比如2e6）在Hmisc包cut2函数抛出一个错误 y = cut2(rnorm(2000000,0,1),m=sqrt(2000000)) Error in if (cj == upper) next : missing value where TRUE/FALSE needed In addition: Warning message: In (1:g) * nnm :

0热度

1回答

四分位数按组数据帧

我有一个看起来像这样的数据保存为新的变量： id <- c(1,1,1,2,2,2,3,3,3,4,4,4,5,5,5,6,6,6,7,7,7,8,8,8,9,9,9) yr <- c(1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3,1,2,3) gr <- c(3,4,5,3,4,5,3,4,5,4,5,6,4,5,6,4,5,6,5,6,7,

-1热度

1回答

在Python中分拣数据

我正在努力了解如何在Python中分拣数据。到目前为止，我已经制定了如何使用边缘： edges = pylab.hist(data, bins=10)[1] 我不确定这是否是最理想的方法，但它的工作！给我一个11个数字的列表，用于制作10个垃圾箱。问题在于如何将数据分类到垃圾箱中，我感到茫然。我试着使用： digitized = np.digitize(data, edges) 但是，这只

1热度

1回答

从R中

数据的完整高斯拟合获得位数我一直在努力为R如何计算位数和数据的正常安装。我有截断正态分布后的数据（见图）我有兴趣从数据和拟合正态分布曲线得到最低的第10百分点值（p = 0.1）。在我的理解，因为数据被截断，这两个应该是完全不同的：我希望从数据中位数比从正常的分布计算的一个更高的，但事实并非如此。对于我所理解的位数功能的帮助从数据中位数应该是默认位数功能： q=quantile(y, p

2热度

1回答

R计算基于分位数的分数

我有一年的数据框（2006年至2010年），4个行业部门，150个公司名称和这些公司的净收入。总共有750个观察值，每个企业每年有一个观察值。我想根据五分制在每个行业年度内为企业的收入分数。因此，每个行业年度收入在前20％的公司得分为5分，接下来的20％得分为4分，依此类推。底部20％的分数为1 样本数据的基础是： Year Industry Firm Income 2006 Chemicals

1热度

2回答

如何拟合变量的每个四分位数的生存模型？

我试图拟合数据集中一个变量的每个四分位数的生存模型。以可用弓步癌症的数据集survival包为例 library(survival) datalung <- lung attach(datalung) fit<- survfit(Surv(time,status) ~ quantile(age)[2:5],type = "kaplan-meier") 但我得到一个错误约长的变量是不同的。

1热度

1回答

使用分位数索引用python替换numpy数组中的条目

我有一个含数字的一维numpy数组，我希望每个数字都替换为它所属的分位数索引。这是我的五分之一人口指数代码： import numpy as np def get_quintile_indices(a): result = np.ones(a.shape[ 0 ]) * 4 quintiles = [ np.percentile(a, 20),

0热度

1回答

昆泰不同数量的观察

我正在使用Stata和调查可变家庭净财富NetWealth）。我要构建这个变量的五分之一，并使用下面的命令 - 你可以看到我使用的调查数据，因此申请调查权： xtile Quintile = NetWealth [pw=surveyweight], nq(5) 然后我给下面的命令来检查什么我已获得： tab Quintile, sum(NetWealth) 这是结果： Means, S

1热度

1回答

GGPLOT2如何建立相应的geom_bar阴谋位数

目前垂直线，我可以创造一个情节像这样： geom_bar ggplot(df.Acc, aes(x = reorder(cities, -accidents), y = accidents)) + geom_bar(stat = "identity", fill="steelblue", alpha=0.75) + geom_hline(yintercept=0, size=0.4, colo

0热度

1回答

闪亮：“位数”不反应性上下文

工作我使用quantile采取用户指定的变量的百分在闪亮应用我在写有任何问题，并且使用这些百分比值设置为一个在x限制直方图输出。我已经尝试了一堆修复建议在相关问题的答案，但不断收到有关反应性，变量类型和NA（即使我有na.rm = TRUE）的不同错误。这个例子是从一个更复杂的应用程序削减，所以我不能显示我已经试过的一切，但我很确定问题发生在quantile命令，并且可能有几个不同的问题我的代