supervised-learning

2热度

2回答

我想了解如何使用scikit进行有监督的机器学习，所以我编写了属于两个不同集合的一些数据：集合A和集合B.我有18个元素集合A和18个元素在集合B中。每个元素都有三个变量。请看下图： #SetA Variable1A = [ 3,4,4,5,4,5,5,6,7,7,5,4,5,6,4,9,3,4] Variable2A = [ 5,4,4,3,4,5,4,5,4,3,4,5,3,4,3,4,4

1热度

2回答

我可以给一个元组或列表的吉文斯在theano

在theano，我在功能可按如下表现： theano.function([index],classifier.errors(y), gives={ x:(trainset_x[0][index*batch:(index+1)*batch],trainset_x[1][index*batch:(index+1)*batch) y:trainset_y[index*batch:(

5热度

2回答

在NLTK中使用自定义标签的培训标记器

我有一个带有标记数据的文档，格式为Hi here's my [KEYWORD phone number], let me know when you wanna hangout: [PHONE 7802708523]. I live in a [PROP_TYPE condo] in [CITY New York]。我想根据一组这样的标记文档来训练模型，然后使用我的模型来标记新文档。这在NLTK中

1热度

1回答

为什么我得到这个错误？ KeyError：“没有”

我使用Alko的代码Expanding English language contractions in Python 我添加了一个位代码。我不明白为什么我收到此=> KeyError异常：“没有” import re import csv fileLocation = 'test.csv' cList = { "ain't": "am not", "aren't": "

1热度

1回答

scikit学习LabelPropagation取代了原来的标签

我尝试学习scikit学习和应用缺失的标签LabelPropagation例如：通过 ... labels = -np.ones(n_samples) labels[0] = outer labels[1] = inner labels[2] = outer labels[-1] = inner ... http://scikit-learn.org/stable/auto_ex

2热度

2回答

在受监督的多类别分类中，为什么使用宏观F1分数而不是平衡准确性？

假设我有一个3级问题，我想要构建一个可以根据一组功能区分类的分类器。我想根据它区分这三类的能力来评估模型。从我的阅读，这听起来像宏F1分数是用来评估对多类问题，其中F1分数为每个类，那么那些F1分数的未加权平均数作为macro F1 score计算分类的通用指标。在其他文献中，我已经看到多类问题使用的平衡精度，其中准确性是针对每个类别计算的，然后将这些精度的未加权平均值用作balanced a

5热度

2回答

TensorFlow MLP不训练XOR

我已经用Google的TensorFlow库构建了MLP。网络正在工作，但不知何故它拒绝正确学习。无论输入的是什么，它总是收敛到接近1.0的输出。完整代码可以看到here。任何想法？的输入和输出（批次大小4）如下： input_data = [[0., 0.], [0., 1.], [1., 0.], [1., 1.]] # XOR input output_data = [[0.], [

1热度

1回答

PyBrain中的预测数据

我根据可用数据进行预测。但他们错了。我不知道为什么。我有代码创建和训练神经网络。 ds = SupervisedDataSet(3, 1) ds.addSample((76.7, 13.8, 103.0), (770,)) ds.addSample((70.9, 13.0, 92.0), (650,)) ds.addSample((65.6, 15.9, 104.3), (713,))

1热度

1回答

有没有一种方法可以使用机器学习对离散和无限比例数据进行分类？

这样的数据： x y 7773 0 9805 4 7145 0 7645 1 2529 1 4814 2 6027 2 7499 2 3367 1 8861 5 9776 2 8009 5 3844 2 1218 2 1120 1 4553 0 3017 1 2582 2 1691 2 5342 0 ... 真正的函数f（x）为：（返回一个十进制整数的

0热度

1回答

如何分类属性本身，而不是值

我有一个数据集，我需要根据属性本身而不是值来对这个数据集进行分类。图片描述的情况：