sklearn-pandas

    0热度

    1回答

    sklearn中的说明可以处理不同类型的数据吗? 例如,在应用Imputer时,字符串和数字都被表示为?, 它仅适用于一种策略。

    4热度

    2回答

    我写了一小段代码来使用sklearn进行线性回归。 我创建了一个2列csv文件(列名为X,Y有一些数字),当我读取文件时,我看到内容已正确读取 - 如下所示。 但是,我得到“unhashable型”的错误,当我尝试使用命令datafile[:,:]或datafile[:,-1]等来指代一列.. 当我尝试使用X作为回应,Y为预测中sklearn的线性回归,我得到如下所示的Value错误。 我在网上查

    7热度

    1回答

    我想安装sklearn-pandas。 在我的尝试: easy_install sklearn-pandas 我得到的结果是: 包安装脚本试图修改系统 上的文件不属于EasyInstall内建成区,并有被中止。 这个包不能被EasyInstall安全地安装,不得即使您运行其设置 手工脚本 支持备用安装位置。请通知软件包的作者和EasyInstall维护人员,以确定修补程序或解决方法是否可用。

    8热度

    3回答

    下面是代码的糊状:SVM sample code 我检查了几个其他的答案对这个问题......它似乎像这个问题的具体迭代有点不同。 首先,我的输入被标准化,并且每点有五个输入。这些值都是合理的大小(健康的0.5s和0.7s等 - 很少接近零或接近1的数字)。 我有大约70 x输入对应于他们的70 y输入。 y输入也被归一化(它们是每个时间步后我函数的百分比变化)。 我初始化我的SVR(和SVC),

    1热度

    1回答

    我是Python的新手,我需要绘制每个属性的相关系数与目标值之间的关系图。我有一个包含大量值的输入数据集。我已经提供了如下的样本数据集值。我们需要预测某个特定的消费者是否会离开公司,因此Result列是目标变量。 SALARY DUE RENT CALLSPERDAY CALL DURATION RESULT 238790 7 109354 0 6 YES 56004 0 2046

    2热度

    2回答

    我试图运行适合我随机森林,但我收到以下错误SKlearn随机森林的错误: forest.fit(train[features], y) 回报 --------------------------------------------------------------------------- ValueError Traceback (most recent call last)

    1热度

    1回答

    我有下面的代码,它只是一个函数,它接受一个输入数据帧并输出一个版本,将它们按label进行分组并将它们相加。 import pandas as pd import random import numpy as np random.seed = 10 input_data = np.array( [ [random.randint(0,9) for x in range(4)]+['g

    1热度

    1回答

    我使用SKlearn的管道模型来提取并构建一个联合特征,然后将其发送到随机森林分类器,而某些特征提取器可以在以后删除或添加,请考虑结构如下: model = Pipeline([ ('feature_extract', FeatureUnion([ ('feature A', extracorA()), ('f