cross-validation

0热度

1回答

我已经使用R中的RandomForest（RF）包利用“rfcv”函数对蛋白质数据进行RF交叉验证。如何使用rfcv对象来预测新的蛋白质数据？

0热度

1回答

我想要为使用Mllib的Java Spark项目实现交叉验证k折叠，以便我可以计算F分数。（这里是一个link到引擎收录代码）考虑一组标记点 JavaRDD<LabledPoint> allData= ...// some labled points 其中每个点被标记为“0”或“1”的。因此它可能看起来像{[1，（2,3）]，[0，（4,6）]，....}。我设法将我的数据分成两部分进行培训

0热度

1回答

scikit ShuffleSplit举起大熊猫“IndexError：索引N超出轴0与大小M的界限”

我想使用scikit的GridSearch来找到一个套索的最佳阿尔法，我想要它迭代的参数之一是交叉验证分割。所以，我在做： # X_train := Pandas Dataframe with no index (auto numbered index) and 62064 rows # y_train := Pandas 1-column Dataframe with no index (au

0热度

1回答

用于回归的python中的培训/验证/测试集

我想将我的数据分成3个部分：培训，验证和测试：70％培训，15％验证和15％回归测试。 Python提供了一种方法，仅用于cross_validation.train_test_split的培训和测试。有任何想法吗？

2热度

2回答

插入符号交叉验证

我想了解插入符控制设置如何工作。我正在通过Caret控制功能使用交叉验证进行一些实验，例如， fitControl <- trainControl(## 10-fold CV method = "repeatedcv", number = 10, ## repeated ten times repeats =

1热度

1回答

交叉验证不兼容形状

我的CSV数据如下： 0.03095566878715169,False 0.9700097239723956,False 0.9756176662740987,False 0.9516273399151274,False 0.21111951544035354,False 0.10371038060888567,False 0.018505911665029413,True 0.3

0热度

1回答

交叉验证的预测成绩相同的

我想选择与具有更好的预测得分数据的CSV文件。我尝试使用下面的代码，以确定交叉验证得分： from __future__ import division import os,csv from sklearn import cross_validation import numpy as np from sklearn import svm from sklearn import met

2热度

1回答

无法使用sklearn的GridSearchCV运行tflearn

我打算在tflearn模型的hyperparams上执行网格搜索。看来，由tflearn.DNN产生的模式是不与sklearn的GridSearchCV预期兼容： from sklearn.grid_search import GridSearchCV import tflearn import tflearn.datasets.mnist as mnist import numpy as

-1热度

1回答

在熊猫中切片数据

这可能是一个非常简单的问题，但这是一个我一直困惑，并坚持一段时间，所以我希望我可以得到一些帮助。我正在使用交叉验证来测试我的数据集，但是我发现索引熊猫df并不像我期待的那样工作。具体来说，当我打印出x_test时，我发现x_test没有数据点。实际上，有索引但没有列。 k = 10 N = len(df) n = N/k + 1 for i in range(k): print

2热度

1回答

使用交叉验证评估逻辑回归

我想使用交叉验证来测试/训练我的数据集并评估整个数据集上的逻辑回归模型的性能，而不仅仅是测试集（例如25％）。这些概念对我来说是全新的，我不太清楚如果我做得对。如果有人能够就我错误的地方采取正确的措施提供建议，我将不胜感激。我的部分代码如下所示。另外，如何在当前图形的同一图表上绘制“y2”和“y3”的ROC？谢谢 import pandas as pd Data=pd.read_csv (