xgboost

1热度

2回答

我目前正在研究一个旨在预测二进制类的机器学习项目（负数：0，正数：1）。数据集不平衡。正值比例为0.1％。我正在使用gini作为我的性能指标运行xgboost模型。问题是，升压迭代期间，它需要大量的奔跑不断提高得分例： [Fold 1/2] [0] train-gini:-0.048192 validation-gini:-0.042979 Multiple eval metrics h

1热度

2回答

h2o.xgboost - 没有GPU，没有多线程

我想补充说这个问题 - is multi-cpu supported by h2o-xgboost? - 但显然我的代表太低。我正在使用h2o（3.14.06）的最新稳定版本。为了试图解决这个问题，我已经确信，GCC是我的搬运工图像中建立（使用apt-get安装GCC） dpkg -l | grep gcc gcc 4:5.3.1-1ubuntu1 amd64 GNU C c

3热度

1回答

如何使用TimeSeriesSplit和GridSearchCV对象在scikit-learn中调整模型？

我已经搜索了sklearn docs for TimeSeriesSplit和docs for cross-validation，但我一直未能找到一个工作示例。我正在使用sklearn版本0.19。这是我的设置 import xgboost as xgb from sklearn.model_selection import TimeSeriesSplit from sklearn.gri

0热度

1回答

在R中绘制xgboost模型的AUC

我目前正在关注以下link的幻灯片。我在幻灯片121/128上，我想知道如何复制AUC。作者没有解释如何这样做（幻灯片124中也一样）。其次，在幻灯片125上生成以下代码; bestRound = which.max(as.matrix(cv.res)[,3]-as.matrix(cv.res)[,4]) bestRound 我收到以下错误; 错误as.matrix（cv.res），2]：下

0热度

1回答

XGBoost模型上的GridSearchCV给出错误

我在python中创建了XGBoost分类器。我试图做GridSearch找到这样 grid_search = GridSearchCV(model, param_grid, scoring="neg_log_loss", n_jobs=-1, cv=kfold) grid_result = grid_search.fit(X, Y) print("Best: %f using %s" %

0热度

1回答

在插入符号中创建RMSLE度量标准

有人可以帮我解决以下问题：我需要将我的xgboost训练模型与插入符号包一起更改为未知错误度量RMSLE。默认情况下，caret和xgboost训练和测量RMSE。这里是行代码：在插入符格式 custom_summary = function(data, lev = NULL, model = NULL){ out = rmsle(data[, "obs"], data[, "pred"])

1热度

1回答

AttributeError：'module'对象在anaconda上没有属性'XGBClassifier'

我在ubuntu上使用python 3.6.2上的Anaconda，并使用“pip install xgboost”安装xgboost，也从here（将pythonpath设置为库），但两者不能工作，总是显示 “ 'module' object has no attribute 'XGBClassifier' ” 下面是我的代码： cv_params = {'max_depth': [3,5,7]

1热度

1回答

没有使用GPU支持XGBClassifier加速

在下面的代码中，我尝试搜索xgboost的不同超参数。 param_test1 = { 'max_depth':list(range(3,10,2)), 'min_child_weight':list(range(1,6,2)) } predictors = [x for x in train_data.columns if x not in ['target', 'id']] gsea

0热度

1回答

类型str没有定义__round__方法错误

试图实现XGBoost来确定最重要的变量，我有一些数组的错误。我的完整代码如下 from numpy import loadtxt from numpy import sort import pandas as pd from xgboost import XGBClassifier from sklearn.model_selection import train_test_split

2热度

3回答

确定为什么要素在决策树模型中很重要

经常利益相关者不希望有一个很好的预测黑箱模型;他们希望了解有关功能的深入了解，以便他们能够向其他人解释。当我们检查xgboost或sklearn渐变增强模型的特征重要性时，我们可以确定特征的重要性......但我们不明白为什么这些特征很重要，是吗？有没有办法解释不仅是什么功能重要，而且为什么它们很重要？我被告知使用shap但即使运行一些样板实例抛出错误，所以我在寻找替代品（或者甚至只是一个程