sklearn-pandas

0热度

1回答

sklearn中的说明可以处理不同类型的数据吗？例如，在应用Imputer时，字符串和数字都被表示为?, 它仅适用于一种策略。

4热度

2回答

我写了一小段代码来使用sklearn进行线性回归。我创建了一个2列csv文件（列名为X，Y有一些数字），当我读取文件时，我看到内容已正确读取 - 如下所示。但是，我得到“unhashable型”的错误，当我尝试使用命令datafile[:,:]或datafile[:,-1]等来指代一列.. 当我尝试使用X作为回应，Y为预测中sklearn的线性回归，我得到如下所示的Value错误。我在网上查

7热度

1回答

使用easy_install和sklearn-pandas

我想安装sklearn-pandas。在我的尝试： easy_install sklearn-pandas 我得到的结果是：包安装脚本试图修改系统上的文件不属于EasyInstall内建成区，并有被中止。这个包不能被EasyInstall安全地安装，不得即使您运行其设置手工脚本支持备用安装位置。请通知软件包的作者和EasyInstall维护人员，以确定修补程序或解决方法是否可用。

8热度

3回答

Sklearn SVM：SVR和SVC，得到同样的预测对于每个输入

下面是代码的糊状：SVM sample code 我检查了几个其他的答案对这个问题......它似乎像这个问题的具体迭代有点不同。首先，我的输入被标准化，并且每点有五个输入。这些值都是合理的大小（健康的0.5s和0.7s等 - 很少接近零或接近1的数字）。我有大约70 x输入对应于他们的70 y输入。 y输入也被归一化（它们是每个时间步后我函数的百分比变化）。我初始化我的SVR（和SVC），

1热度

1回答

如何使用Python绘制数据集的每个属性与目标属性之间的相关系数的图表

我是Python的新手，我需要绘制每个属性的相关系数与目标值之间的关系图。我有一个包含大量值的输入数据集。我已经提供了如下的样本数据集值。我们需要预测某个特定的消费者是否会离开公司，因此Result列是目标变量。 SALARY DUE RENT CALLSPERDAY CALL DURATION RESULT 238790 7 109354 0 6 YES 56004 0 2046

2热度

2回答

输入

我试图运行适合我随机森林，但我收到以下错误SKlearn随机森林的错误： forest.fit(train[features], y) 回报 --------------------------------------------------------------------------- ValueError Traceback (most recent call last)

1热度

1回答

大熊猫想告诉我什么是警告？

我有下面的代码，它只是一个函数，它接受一个输入数据帧并输出一个版本，将它们按label进行分组并将它们相加。 import pandas as pd import random import numpy as np random.seed = 10 input_data = np.array( [ [random.randint(0,9) for x in range(4)]+['g

1热度

1回答

ScikitLearn从管道内的FeatureUnion中提取特征名称

我使用SKlearn的管道模型来提取并构建一个联合特征，然后将其发送到随机森林分类器，而某些特征提取器可以在以后删除或添加，请考虑结构如下： model = Pipeline([ ('feature_extract', FeatureUnion([ ('feature A', extracorA()), ('f