cross-validation

    0热度

    1回答

    我已经使用R中的RandomForest(RF)包利用“rfcv”函数对蛋白质数据进行RF交叉验证。 如何使用rfcv对象来预测新的蛋白质数据?

    0热度

    1回答

    我想要为使用Mllib的Java Spark项目实现交叉验证k折叠,以便我可以计算F分数。 (这里是一个link到引擎收录代码)考虑一组标记点 JavaRDD<LabledPoint> allData= ...// some labled points 其中每个点被标记为“0”或“1”的。因此它可能看起来像{[1,(2,3)],[0,(4,6)],....}。我设法将我的数据分成两部分进行培训

    0热度

    1回答

    我想使用scikit的GridSearch来找到一个套索的最佳阿尔法,我想要它迭代的参数之一是交叉验证分割。所以,我在做: # X_train := Pandas Dataframe with no index (auto numbered index) and 62064 rows # y_train := Pandas 1-column Dataframe with no index (au

    0热度

    1回答

    我想将我的数据分成3个部分:培训,验证和测试:70%培训,15%验证和15%回归测试。 Python提供了一种方法,仅用于cross_validation.train_test_split的培训和测试。有任何想法吗?

    2热度

    2回答

    我想了解插入符控制设置如何工作。我正在通过Caret控制功能使用交叉验证进行一些实验,例如, fitControl <- trainControl(## 10-fold CV method = "repeatedcv", number = 10, ## repeated ten times repeats =

    1热度

    1回答

    我的CSV数据如下: 0.03095566878715169,False 0.9700097239723956,False 0.9756176662740987,False 0.9516273399151274,False 0.21111951544035354,False 0.10371038060888567,False 0.018505911665029413,True 0.3

    0热度

    1回答

    我想选择与具有更好的预测得分数据的CSV文件。 我尝试使用下面的代码,以确定交叉验证得分: from __future__ import division import os,csv from sklearn import cross_validation import numpy as np from sklearn import svm from sklearn import met

    2热度

    1回答

    我打算在tflearn模型的hyperparams上执行网格搜索。看来,由tflearn.DNN产生的模式是不与sklearn的GridSearchCV预期兼容: from sklearn.grid_search import GridSearchCV import tflearn import tflearn.datasets.mnist as mnist import numpy as

    -1热度

    1回答

    这可能是一个非常简单的问题,但这是一个我一直困惑,并坚持一段时间,所以我希望我可以得到一些帮助。 我正在使用交叉验证来测试我的数据集,但是我发现索引熊猫df并不像我期待的那样工作。具体来说,当我打印出x_test时,我发现x_test没有数据点。实际上,有索引但没有列。 k = 10 N = len(df) n = N/k + 1 for i in range(k): print

    2热度

    1回答

    我想使用交叉验证来测试/训练我的数据集并评估整个数据集上的逻辑回归模型的性能,而不仅仅是测试集(例如25%)。 这些概念对我来说是全新的,我不太清楚如果我做得对。如果有人能够就我错误的地方采取正确的措施提供建议,我将不胜感激。我的部分代码如下所示。 另外,如何在当前图形的同一图表上绘制“y2”和“y3”的ROC? 谢谢 import pandas as pd Data=pd.read_csv (