我可以用下面的方法做的二进制数据的交叉验证,但似乎不工作的多类数据: > cross_validation.cross_val_score(alg, X, y, cv=cv_folds, scoring='roc_auc')
/home/ubuntu/anaconda3/lib/python3.6/site-packages/sklearn/metrics/scorer.py in __cal
使用基于项目的协作过滤,我们利用类似用户对给定用户的项目评分来生成推荐。研究经常建议使用保留测试集来评估算法,例如20%的数据与80%的培训。但是,如果在特定项目的所有评级都被拒绝的情况下呢?我们的培训数据将不再包含该项目,并且永远不会推荐。 E.g. 5个用户每人观看10部电影,其中之一是'泰坦尼克号'。我们随机推出了每个用户20%数据的测试集= 2部电影/用户。如果“泰坦尼克号”在每个用户的测
此问题之前已被多次询问。但是当我回答下面的问题时,我得到一个错误: 首先我指定哪一部分是训练集和验证集,如下所示。 my_test_fold = []
for i in range(len(train_x)):
my_test_fold.append(-1)
for i in range(len(test_x)):
my_test_fold.append(0)
然