missing-data

    0热度

    1回答

    我是新来的,正在使用散景0.10.0,跟在example之后。 我介绍失踪的大熊猫DF值由 # Swap a real numeric value to missing data['Jan'][0] = np.nan 行后 data = data.set_index('Year') 当它运行时,它给出了一个错误 Traceback (most recent call last):

    0热度

    1回答

    我正在使用来自UCI的此数据集breastcancer,但它包含缺失值。任何人都可以帮我解决它吗?我是ML新手,对丢失值技术我不太了解。这里是数据集cancerdata的链接。 我试着读该代码: data <- read.csv('D:/cancer.csv', header=FALSE) # Reading the data for(i in 1:ncol(data)) { dat

    1热度

    1回答

    我有一个纵向数据集,我在lme4中使用lmer执行HLM分析。我想将此分析的结果与相同数据的结果进行比较,但在nlme包中使用gls。 对于数据集中的每个参与者有多种度量方法,并且有些参与者在一个或多个时间点缺少值。 lmer似乎并不具有这样的问题,但是当我跑使用gls相同的分析我得到一个错误信息 Error in na.fail.default(list(id = c(1001L, 1002L,

    0热度

    1回答

    我有一个变量名为studentData的变量有5列的数据。每列有326行,但有一行有3行缺失。每列是一个5点likert值,从集合mylevels <- c('Strongly disagree', 'Disagree', 'Neither agree nor disagree', 'Agree', 'Strongly agree') 当我打印每列的级数时,它给我的价值为6第二列(studentD

    1热度

    1回答

    我是新来的使用R,我试图建立一个决策树。我已经使用ctree和rpart for rpart的包装派对。 但是,因为我需要为我的模型进行交叉验证,所以我开始使用插入符号包,因为我可以通过使用函数train()和我想要使用的方法来实现。 library(caret) cvCtrl <- trainControl(method = "repeatedcv", repeats = 2,

    3热度

    1回答

    我正在处理一些大矩阵,其值与对角线类似,如下所示。 ontrack <- matrix(c( runif(1),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA, runif(1),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA,NA, NA,NA,runif(1),NA,NA,NA,NA,NA,NA,NA,NA,NA,NA

    2热度

    2回答

    我被困在一些我认为可以很容易地在使用Numpy的几行中解决的事情,我只是没有看到它。让我们来定义包含一些缺失值的实例阵列: import numpy as np input_data = np.array([[1,3,5,8,6],[3,np.nan,np.nan,5,6],[np.nan,6,7,np.nan,2]]) Out[530]: [[1, 3, 5, 8, 6], [3, nan

    3热度

    5回答

    我有一个类似这样的数据集,其中某些年份的数据缺失。 County Year Pop 12 1999 1.1 12 2001 1.2 13 1999 1.0 13 2000 1.1 我想是这样 County Year Pop 12 1999 1.1 12 2000 NaN 12 2001 1.2 13 1999 1.0 13 2000 1.1 13 200

    1热度

    3回答

    我有数据位数的数据从https://drive.google.com/file/d/0B9YMMvghK2ytSXI4RFo0clNLc28/view 基本上〜60万行 它已经失踪了一个价值的钻石数据集的缺失数据。我想与特定的颜色 summary(BigDiamonds) ## X1 carat cut color ## Min. : 1 Min. :0.200 Len

    -1热度

    1回答

    以我分类问题,一些功能(〜5)中85层的特征具有大多空值(> 90%)。我如何处理这些值?难道我, 1)忽略这些列/功能完全 2)尝试,如果是如何归咎于这些值? 3)的任何其他方法? 我开始用随机森林,我是一个新手,以这种方法,并随机森林自行处理空值?我怎样才能实现这个?随机森林如何做到这一点?我在哪里可以了解到这一点 - 任何参考将非常受欢迎。 在此先感谢。