scikit-learn

    0热度

    1回答

    最近我正在研究Dimension Reduction方法,我发现python包“sklearn.feature_selection”看起来很有用,但问题在于SelectPercentile.fit方法没有解释它如何计算得分函数。 link 有谁知道它是如何工作的?先谢谢了。例如,如果我为“SelectPercentile”选择“SelectFdr”,并且SelectFdr方法的标准取决于每个要素的

    1热度

    1回答

    import numpy as np temp_data_x = np.random.randn(200,3) temp_data_y = temp_data_x[:,0] + temp_data_x[:,1] + temp_data_x[:,2] + np.random.randn(200,1).reshape(200,) from sklearn.neural_network impor

    0热度

    1回答

    我想重现一个教程看到 here。 一切工作完美,直到我用我的训练集添加.fit方法。 这里是我的代码示例: # TRAINING PART train_dir = 'pdf/learning_set' dictionary = make_dic(train_dir) train_labels = np.zeros(20) train_labels[17:20] = 1 train_m

    0热度

    1回答

    包版本: numpy的:1.13.3 sklearn:0.19.0 SciPy的:0.19.1 我有一个致密的基质svd_matrix svd_matrix.shape >>> (30000,50) 我要到t使用“余弦”作为度量标准 tsne = sklearn.manifold.TSNE(n_components=2, random_state=0, metric='cosine') m

    1热度

    1回答

    我想将投票分类器应用于多个管道分类器并调整网格搜索中的参数。最小的例子给我一个错误。我必须以不同的方式做到这一点吗? from sklearn.ensemble import RandomForestClassifier from sklearn.ensemble import AdaBoostClassifier from sklearn.ensemble import VotingClas

    1热度

    1回答

    我正在尝试通过创建一个字符文本的热编码来准备数据文件,我可以稍后使用这些编码来训练我的模型进行分类。我有一个由字符行组成的训练数据文件,我最初正在做它们的整数编码,然后是一个热门编码。 例如这是数据文件的外观: afafalkjfalkfalfjalfjalfjafajfaflajflajflajfajflajflajfjaljfafj fgtfafadargggagagagagagavcacac

    1热度

    1回答

    语境下的测试误差正确方法: 据穆勒的“入门机器学习与蟒蛇”推荐工作流,人会做一个单一的分数评价对一个测试组是在过程的开始搁置: 这样做的好处来获得其超参数设置,在可能使用多个(不同的)模型嵌套交叉验证一个给定的模型。 单个测试集的评估给出了具有高方差的估计器。 问题: 有没有什么办法让比这个单一的分数更好的泛化误差估计? (即使这种方法需要更多的训练迭代)

    1热度

    1回答

    我使用GridSearchCV与管道管线内部方差解释如下: grid = GridSearchCV( Pipeline([ ('reduce_dim', PCA()), ('classify', RandomForestClassifier(n_jobs = -1)) ]), param_grid=[ { 'reduc

    0热度

    2回答

    我想查看LinearRegression的源代码,但linear_model文件夹中没有像LinearRegression.py这样的文件。 当我写一个程序: from sklearn import linear_model regr = linear_model.LinearRegression() 它的工作原理,所以我假设线性回归包括在我的图书馆。 我使用anaconda3与Python

    1热度

    1回答

    user1190882帮助固定TRANSPOSE(移调)的问题,我会打开一个新的线程为SKlearn问题 columns_train = np.array([df['A'], df['B'], df['C'], df['D'], df['E'], df['F'], df['G']]) X = columns_train Y = columns_target X = np.transpose