resampling

    0热度

    1回答

    我的数据集有两个类。无兴趣者占90%,兴趣类约占10%。 我已经完成了重采样,不仅是一次,而且是一组平衡集(例如10组)。并做大多数投票来得到最终的预测结果。经过比较许多模型,树给出最好的结果。而且我已经根据重要性分数选出了最重要的功能。 整体准确度并不差,75%,但对我感兴趣的班的精度只有30%,这并不好。如何对目标类的精度进行优化?我认为R中ctree包的算法是对整体精度进行优化。我也尝试过像

    3热度

    1回答

    实际问题 如所示的这个小例子,我尝试每周重新取样大熊猫数据帧: import datetime import pandas as pd df = pd.DataFrame([{ 'A' : datetime.datetime.now() - datetime.datetime.now(), 'B' : 2 },{ 'A' : datetime.datetime

    1热度

    1回答

    我有以下问题: 我有4袋20个值在每个当中,并且我随机从各4袋挑10的样品: for (i in 1:20){ bag1[i] = sample(0:50,1) bag2[i] = sample(0:50,1) bag3[i] = sample(0:50,1) bag4[i] = sample(0:50,1) } for (j in 1:10){

    2热度

    1回答

    考虑下面的伪数据: x <- rnorm(15,mean = 3,sd = 1) y <- rnorm(15,mean = 3,sd = 1) xy <- c(x,y) factor <- c(rep('A',15),rep('B',15)) df1 <- data.frame(xy,factor) df1$PAIR_IDENTIFIER <- 1:15 现在,我们希望测试的手段是

    54热度

    5回答

    在crontab中,我可以用星号表示每个值,或者“*/2”表示每个偶数值。 有没有办法指定每个奇数的值? (会像 “1 + */2” 的工作?)

    1热度

    1回答

    我正在用MediaCodec/MediaExtractor/AudioTrack等构建自定义音频播放器,这些音频混合并播放多个音频文件。 因此,如果其中一个文件具有不同的采样率,我需要重采样算法。 我可以看到,有一个天然的AudioResample类可供选择: https://android.googlesource.com/platform/frameworks/av/+/jb-mr1.1-re

    0热度

    2回答

    我的问题是关于如何提高函数的性能,从矩阵的列中下采样而不用替换(又称为“稀疏矩阵”......我知道这里提到了这个here,但是我找不到明确答案a)做我需要的; b)快速完成)。 这里是我的功能: downsampled <- function(data,samplerate=0.8) { data.test <- apply(data,2,function(q) { name

    3热度

    1回答

    我有一个熊猫df,时间序列经过34毫秒,我只需要5秒的分辨率。我最初创建了一个时间戳,并试图将时间戳设置为索引,并重新采样和.iloc。 # Defining file path file = "C:/file/path/data.csv" # Read in data and parse date/time to DateTime format data = pd.read_csv(fi

    0热度

    1回答

    我有一组数据如下所示。它有一个开始时间和结束时间。对于每一行,都有一些核心值。 Block_start Block_end Total Coal Waste 01/20/2016 5:00 01/20/2016 5:23 1284 0 1284 01/20/2016 5:23 01/20/2016 6:44 5755 0 5755 01/20/2016 6:44 01/20

    1热度

    3回答

    这是我 function GetEventsList(){ $result = mysql_query("SELECT * FROM `events`") or trigger_error(mysql_error()); while($row = mysql_fetch_array($result)){ foreach($row AS $key => $value)