xgboost

    1热度

    2回答

    我目前正在研究一个旨在预测二进制类的机器学习项目(负数:0,正数:1)。数据集不平衡。正值比例为0.1%。 我正在使用gini作为我的性能指标运行xgboost模型。 问题是,升压迭代期间,它需要大量的奔跑不断提高得分 例: [Fold 1/2] [0] train-gini:-0.048192 validation-gini:-0.042979 Multiple eval metrics h

    1热度

    2回答

    我想补充说这个问题 - is multi-cpu supported by h2o-xgboost? - 但显然我的代表太低。 我正在使用h2o(3.14.06)的最新稳定版本。 为了试图解决这个问题,我已经确信,GCC是我的搬运工图像中建立(使用apt-get安装GCC) dpkg -l | grep gcc gcc 4:5.3.1-1ubuntu1 amd64 GNU C c

    3热度

    1回答

    我已经搜索了sklearn docs for TimeSeriesSplit和docs for cross-validation,但我一直未能找到一个工作示例。 我正在使用sklearn版本0.19。 这是我的设置 import xgboost as xgb from sklearn.model_selection import TimeSeriesSplit from sklearn.gri

    0热度

    1回答

    我目前正在关注以下link的幻灯片。我在幻灯片121/128上,我想知道如何复制AUC。作者没有解释如何这样做(幻灯片124中也一样)。其次,在幻灯片125上生成以下代码; bestRound = which.max(as.matrix(cv.res)[,3]-as.matrix(cv.res)[,4]) bestRound 我收到以下错误; 错误as.matrix(cv.res),2]:下

    0热度

    1回答

    我在python中创建了XGBoost分类器。我试图做GridSearch找到这样 grid_search = GridSearchCV(model, param_grid, scoring="neg_log_loss", n_jobs=-1, cv=kfold) grid_result = grid_search.fit(X, Y) print("Best: %f using %s" %

    0热度

    1回答

    有人可以帮我解决以下问题:我需要将我的xgboost训练模型与插入符号包一起更改为未知错误度量RMSLE。默认情况下,caret和xgboost训练和测量RMSE。 这里是行代码: 在插入符格式 custom_summary = function(data, lev = NULL, model = NULL){ out = rmsle(data[, "obs"], data[, "pred"])

    1热度

    1回答

    我在ubuntu上使用python 3.6.2上的Anaconda,并使用“pip install xgboost”安装xgboost,也从here(将pythonpath设置为库),但两者不能工作,总是显示 “ 'module' object has no attribute 'XGBClassifier' ” 下面是我的代码: cv_params = {'max_depth': [3,5,7]

    1热度

    1回答

    在下面的代码中,我尝试搜索xgboost的不同超参数。 param_test1 = { 'max_depth':list(range(3,10,2)), 'min_child_weight':list(range(1,6,2)) } predictors = [x for x in train_data.columns if x not in ['target', 'id']] gsea

    0热度

    1回答

    试图实现XGBoost来确定最重要的变量,我有一些数组的错误。 我的完整代码如下 from numpy import loadtxt from numpy import sort import pandas as pd from xgboost import XGBClassifier from sklearn.model_selection import train_test_split

    2热度

    3回答

    经常利益相关者不希望有一个很好的预测黑箱模型;他们希望了解有关功能的深入了解,以便他们能够向其他人解释。 当我们检查xgboost或sklearn渐变增强模型的特征重要性时,我们可以确定特征的重要性......但我们不明白为什么这些特征很重要,是吗? 有没有办法解释不仅是什么功能重要,而且为什么它们很重要? 我被告知使用shap但即使运行一些样板实例抛出错误,所以我在寻找替代品(或者甚至只是一个程