quantile

    1热度

    1回答

    我试图用熊猫们喜欢qcut方法如下计算两列的位数: my_df['float_col_quantile'] = pd.qcut(my_df['float_col'], 100, labels=False) my_df['int_col_quantile'] = pd.qcut(my_df['int_col'].astype(float), 100, labels=False) 列float_

    -2热度

    1回答

    我是R的新手,我一直在面对这个问题。 每当我试图使十分位数或四分位数使用“dplyr”包,我十分位获得合并到更少的组。 像欲10个不同的基团,而我只得到6,4或有时只3. 我知道R期望可以组/合并小十分位数,如果它有较小的数据。 但我想避免这个问题。请帮忙! 谢谢! 代码: mydata <- data.frame(col1= c(0,00,0,0,0,0,0,0,0,0,0,0,0,0,0,0,

    0热度

    2回答

    在下面的代码中,我如何只保留高于第95个分位数的观察值? data test; input business_ID $ count; datalines; 'busi1' 2 'busi1' 10 'busi1' 4 'busi2' 1 'busi3' 2 'busi3' 1 ; run; proc sort data = test; by descending

    0热度

    1回答

    如果我有一个矩阵列表具有相同的维度,我怎样才能得到R中矩阵列表的每个元素?例如,我有4个矩阵: > a [,1] [,2] [,3] [1,] -0.8761453 0.2821336 -0.8541406 [2,] -0.9649200 1.7734091 -1.2058440 [3,] -0.4250063 -0.8197162 -1.3997540 > b

    1热度

    2回答

    我是R新手。在使用R之前,我使用了GraphPad Prism 7.0。 Só现在我试图比较两个数据处理器。我在分位数计算中创建了一个区别,所以任何人都知道他们为什么是不同的? 在R I具有 par(pty="s", cex.axis=1, las=1, cex.lab=1) a1=c(22.02, 23.83, 26.67, 25.38, 25.49, 23.50, 25.90, 24.89,

    0热度

    1回答

    我使用下面的代码尝试用特定的值替换低于底部2.5%和高于顶部97.5%的变量值。您可以执行该代码。它提供了开放的数据文件。 credit<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE) fun <- function(x){ quantiles <- quantile(x, c(.02

    0热度

    1回答

    我想根据第1,第3和第4个分位数(即0-25%,25%-75%,75% 100%)。我已经使用了下面的代码,但是零不包含在分档中。它们显示为NA。 rawdata1$usage4 <- cut(rawdata1$Usage_Percentage, breaks = quantile(rawdata1$Usage_Percentage, probs = c(-Inf,0.25

    0热度

    2回答

    我制作了quantiles与cut2函数大小相同,现在我想通过4个分位数制作4个不同的子集。 第一和第四位数,我可以与该亚群功能使: quantile1 <- subset (trial, NAG <22.1) quantile4 <- subset(trial, NAG >=61.6) 但是,如果我试图让第二和第三位数的子集,它完全不是那么回事,我不明白为什么。这是我已经试过: quan

    -1热度

    1回答

    我想子集数据框架只保留每个分类变量的第99.5百分位数。 我的数据已经用=分钟 和位置分钟=位置 我想拿出分钟数据的顶部.5成每个位置。 新的子集将有99.5个百分点的位置1. 99.5百分位置2,等等 谢谢!

    0热度

    1回答

    我在R中使用汽车包生成qqplot,但无法调整x和y比例。该图是这样的: 我需要炸毁的X和Y轴来看看他们是置信区间的距离。有没有办法解决这个问题? 汽车包中的qqPlot函数没有参数XLIM和ylim Arguments of qqPlot in car package