machine-learning

    -2热度

    1回答

    我已经使用下面的代码进行分类。我得到55%到60%的变量准确度。 我想提高我的准确率高达85%-90%。我分为8个不同的类别。我应该采取什么措施来提高准确性。 import pandas as pd import numpy as np from sklearn.feature_extraction.text import CountVectorizer from sklearn.featu

    -1热度

    1回答

    我有一个数据集,我想为它建立一个分类模型。鉴于scikit-learn提供了混淆矩阵实现confusion_matrix(test_y, pred_r),我想用它来计算我的模型的准确性,而不是直接使用.predict。为此,我应该只查找false positive或true positive或两者的组合? 谢谢

    0热度

    1回答

    我试图弄清楚为什么LinearRegressionWithSGD不适用于Spark的ParamGridBuilder。从火花文档: lr = LinearRegression(maxIter=10) paramGrid = ParamGridBuilder()\ .addGrid(lr.regParam, [0.1, 0.01]) \ .addGrid(lr.fitIntercept, [F

    0热度

    1回答

    下面的Tensorflow代码,我正在用来检查一个小技巧,回归。 x = tf.placeholder(tf.float32, [None, input_size], name="input_data") y = tf.placeholder(tf.float32, [None], name="input_data") W1 = tf.get_variable("W1", [input_si

    0热度

    1回答

    下面是用Keras编写的代码,用于回归正弦函数。它工作完美。 import numpy as np from keras.layers import Dense, Activation from keras.models import Sequential import matplotlib.pyplot as plt import math import time x = np.a

    1热度

    1回答

    我想写一个神经网络,从头开始识别xor函数。完整的代码是here(在python 3中)。 我目前得到的错误: ValueError: No gradients provided for any variable, check your graph for ops that do not support gradients 我是新来tensorflow,我不明白这是为什么。任何人都可以帮我纠正

    -1热度

    1回答

    我是机器学习的新手请原谅我,如果我愚蠢。 我有一个包含22个属性和30000个数据点的traindata.csv文件。 我必须训练我的模型(不是特定的算法),并预测testdata.csv文件中的20000个数据点,我必须使用我的训练模型进行预测。 在traindata.csv中,'0'和'1'类标签的比例为5:1。 如果我用这整列火车数据训练我的模型,我的模型显示了一些偏向于预测0的比例。 我以

    2热度

    3回答

    经常利益相关者不希望有一个很好的预测黑箱模型;他们希望了解有关功能的深入了解,以便他们能够向其他人解释。 当我们检查xgboost或sklearn渐变增强模型的特征重要性时,我们可以确定特征的重要性......但我们不明白为什么这些特征很重要,是吗? 有没有办法解释不仅是什么功能重要,而且为什么它们很重要? 我被告知使用shap但即使运行一些样板实例抛出错误,所以我在寻找替代品(或者甚至只是一个程

    0热度

    1回答

    是谷歌告诉我的是: 对于keras的ImageDataGenerator功能似乎已经可以开箱即用的zca_whitening。但是如果设置了该选项,则需要在整个数据集X上调用ImageDataGenerator.fit。所以这不是一个选项。 对于sklearn,IncrementalPCA似乎与一个巨大的数据集一起工作,但我不知道如何将PCA旋转到ZCA的发生器风格。 感谢您的帮助!

    -2热度

    1回答

    我正在为我们的项目之一探索Azure认知服务。我们有一个名为DewaList.com的分类社区网站,该网站正在与垃圾邮件作斗争。我们有一个机器人过程自动化(RPA),根据我们作为人类识别并标记为垃圾邮件的列出的垃圾邮件关键字来识别和删除广告。 我们的下一个项目是使用本机学习智能生成垃圾邮件关键字列表。逻辑是定期观看新广告,或者一周或一个月内即将到来的广告,以及是否在一天或一周内重复多次。然后将其标