cross-validation

    2热度

    1回答

    在caret包中,有一个名为trainControl的东西,它允许我们执行各种交叉验证。为了执行10倍交叉验证中,应当使用 fitControl <- trainControl(method= "repeatedcv", number = 10, repeats = 10) fitJ48_10_fold <- train(x = x, y =y, method = "J48", trContro

    0热度

    1回答

    我已经创建了一个函数来执行从库(MASS)的数据集birthwt 10交叉验证。函数内的代码正在做我想做的事情。但是,我想使用函数外返回的值,但我不能访问函数外的mean_mrate变量。 我的代码是: library(MASS) tenfold3 = function() { fold = 10 end = nrow(birthwt) fold_2 = flo

    2热度

    1回答

    (ML中的noob,耐心) 我想测试我的scikit-learn SVMLinear分类器的性能。我的火车集有不同于实际人口的班级分布,但我的测试集是一个代表,并且像实际人口一样分布。 我注意到有一个类的重量参数,我想尝试给我的分类器实际的人口分布,看看它是否有助于它的表现更好。 但是 - 由于我的火车集分布不同,所以将我的验证集,对吧?那么我应该期望验证有所改进,还是必须使用我的测试集来查看改进

    2热度

    1回答

    我正在研究关于葡萄酒质量的UCI数据集。我已经应用了多个分类器,而k-最近的邻居就是其中之一。我想知道是否有一种方法可以通过5倍交叉验证找到最近邻居的k的确切值。如果是的话,我该如何申请?我如何使用5倍简历来获得决策树的深度? 谢谢!

    9热度

    1回答

    与Custom cross validation split sklearn类似我想为GridSearchCV定义我自己的拆分,为此我需要定制内置的交叉验证迭代器。 我想将我自己的一套列车测试指标交叉验证传递给GridSearch,而不是让迭代器为我确定它们。我浏览了sklearn文档页面上的可用cv迭代器,但找不到它。 比如我想实现这样的事情 数据有9个样品 为2倍CV创建我自己的一套培训测试指

    3热度

    1回答

    我一直在尝试使用Python和scikit-learn工具包来训练ML分类器。 首先我申请我自己的阈值(如int(LEN(X)* 0.75)),在将数据集和打印我的指标时,得到了这样的结果: precision recall f1-score support 1 0.63 0.96 0.76 23 2 0.96 0.64 0.77 36 avg/t

    0热度

    1回答

    我正在为我的数据进行QSAR研究,并在通过DRAGON软件运行我的结构并获取描述符后,剩下383个描述符(移除常量和全部)。 现在我想对我的数据执行特征选择。其中n = 26和p = 383。那么我应该遵循什么方法? 我已经做了一些明智的回归分析以及遗传算法研究,以获得7个非常合适的描述符的R2值为0.831。 但我想尝试其他方法,例如随机森林方法,PLS或PCA来处理我的数据。我使用相同的R。因

    0热度

    1回答

    因此,目前我有一个机器学习类型设置与人工神经网络类型的系统设置..数据查询时,我得到的时候要求说一个特定的日期和时间和某件事的成功(不能谈论什么)。 然后我可以得到这个问题的列表。现在我有一个包含元数据的列表,这些元数据被标记为成功或失败(这是基于另一个算法来决定的),我怎么能从这个数据模型预测未来事件是否最有可能。 线性回归是最佳选择吗? 任何建议将是非常有用的:)!

    -1热度

    1回答

    我在Matlab中使用newff函数来训练我的数据集。现在,我想验证我的NN用于新数据集。我输出训练NN的权重和偏差,并将其用于新的数据集。由于训练NN中的输入变量被标准化(在1和-1之间)[目标值未标准化],因此训练数据集的计算输出具有负值。 我想我应该重新调整输入和输出以获得正确的值。但我不知道怎么可能会被执行? 净= newff(最小最大[],[20 20 20 1],{ '正切S型' '正

    0热度

    1回答

    我想,但是我做我的错误 Error in model.frame.default(formula = lindata$Y ~ 0 + lindata$HomeAdv + : variable lengths differ (found for 'air-force-falcons') 空军 - 猎鹰每次上线性模型cv.glm是在数据集中lindata的第一个变量。当我运行glm时,我没有任何