naivebayes

    -1热度

    1回答

    我有以下问题:我想用贝叶斯分类器使用两个变量“性别”和“年龄组”来描述因子变量“癌症”(是或否)。 这些是我的(虚构的)样本数据: install.packages("e1071") install.packages("gmodels") library(e1071) library(gmodels) data<-read.csv("http://www.reduts.net/cance

    0热度

    2回答

    我试图找到10000次模拟中掷硬币30次的最长运行的平均值。我需要在R中模拟上述的实验10,000次,并且每次记录最长运行的长度。 这里是我到目前为止的代码: coin <- sample(c("H", "T"), 10000, replace = TRUE) table(coin) head(coin, n = 30) rle(c("H", "T", "T", "H", "H", "H",

    0热度

    1回答

    我使用spark mllib来训练naive-bayes分类器模型,其中我创建了一个管道来索引我的字符串特征,然后规范化并应用PCA降维,之后我训练我的朴素贝叶斯模型。当我运行管道时,我在PCA组件向量中得到负值。在Google上搜索时发现我必须应用NMF(非负矩阵分解)来获得正向量,并且我发现ALS将使用方法.setnonnegative(true)来实现NMF。 ,但我不知道如何将PCA后的A

    0热度

    1回答

    我使用sklearn GaussianNB来分析一个数据集,我想从sklearn随机森林中产生一个方便的特征重要性图,如this one。 GaussianNB支持n_features,但似乎没有相当于forest.feature_importances_ :(任何想法,我怎么能解决这个问题?

    0热度

    1回答

    我想运行一个sklearn.naive_bayes.GaussianNB模型与partial_fit。为此,我计算priors这样的: unique_lbls, counts = np.unique(labels, return_counts=True) counts = counts.astype(float) priors = counts/counts.sum() model = Ga

    1热度

    1回答

    我确实使用包klaR将朴素贝叶斯应用于玩具数据集,并且一切正常。 接下来,我想用method="nb"caret,这确实是只有在klaR包NaiveBayes函数的包装来复制相同的分析。 但是,后者的估计不起作用。我收到一条错误消息。 Error in NaiveBayes.default(x, y, usekernel = FALSE, fL = param$fL, ...) : Ze

    0热度

    2回答

    我想实现像这样的高斯NB训练。然而,如果X的尺寸不相等(即X内的所有列表需要长度相同),则gnb.fit()会引发异常。如果我的训练样本是不同长度的向量,调用fit()的正确方法是什么? def train(X, Y): gnb = GaussianNB() gnb.fit(X, Y) return gnb >>> X = [[1,2,3], [4,5,6,7],

    0热度

    1回答

    我想让我的MultinomialNB工作。我在训练和测试集上使用CountVectorizer,当然两个setz中都有不同的词。所以我看到,为什么错误发生,但我不知道如何解决它。我试图CountVectorizer().transform,而不是作为CountVectorizer().fit_transform在其他职位(SciPy and scikit-learn - ValueError: D

    0热度

    1回答

    我使用下面的代码训练我的数据: start_time := clock_timestamp(); PERFORM madlib.create_nb_prepared_data_tables('nb_training', 'class', 'attributes', 'ARRAY[1,2,3,4

    0热度

    1回答

    I write python code like this train_x, test_x, train_y, test_y = train_test_split(x, y, random_state=33, train_size=0.7) #lsvc=LinearSVC() #lsvc.fit(train_x, train_y) #y_predict=lsvc.predict(tr