naivebayes

-1热度

1回答

我有以下问题：我想用贝叶斯分类器使用两个变量“性别”和“年龄组”来描述因子变量“癌症”（是或否）。这些是我的（虚构的）样本数据： install.packages("e1071") install.packages("gmodels") library(e1071) library(gmodels) data<-read.csv("http://www.reduts.net/cance

0热度

2回答

贝叶斯统计：模拟在R中，上述实验10,000次，每次注意最长运行的长度

我试图找到10000次模拟中掷硬币30次的最长运行的平均值。我需要在R中模拟上述的实验10,000次，并且每次记录最长运行的长度。这里是我到目前为止的代码： coin <- sample(c("H", "T"), 10000, replace = TRUE) table(coin) head(coin, n = 30) rle(c("H", "T", "T", "H", "H", "H",

0热度

1回答

如何在我的火花管道中集成ALS来实现非负矩阵分解？

我使用spark mllib来训练naive-bayes分类器模型，其中我创建了一个管道来索引我的字符串特征，然后规范化并应用PCA降维，之后我训练我的朴素贝叶斯模型。当我运行管道时，我在PCA组件向量中得到负值。在Google上搜索时发现我必须应用NMF（非负矩阵分解）来获得正向量，并且我发现ALS将使用方法.setnonnegative（true）来实现NMF。，但我不知道如何将PCA后的A

0热度

1回答

高斯NB机器学习 - 特征分析

我使用sklearn GaussianNB来分析一个数据集，我想从sklearn随机森林中产生一个方便的特征重要性图，如this one。 GaussianNB支持n_features，但似乎没有相当于forest.feature_importances_ :(任何想法，我怎么能解决这个问题？

0热度

1回答

用scikit学习partial_fit返回ValueError：先验的总和应该是1

我想运行一个sklearn.naive_bayes.GaussianNB模型与partial_fit。为此，我计算priors这样的： unique_lbls, counts = np.unique(labels, return_counts=True) counts = counts.astype(float) priors = counts/counts.sum() model = Ga

1热度

1回答

klaR和脱字符的朴素贝叶斯

我确实使用包klaR将朴素贝叶斯应用于玩具数据集，并且一切正常。接下来，我想用method="nb"caret，这确实是只有在klaR包NaiveBayes函数的包装来复制相同的分析。但是，后者的估计不起作用。我收到一条错误消息。 Error in NaiveBayes.default(x, y, usekernel = FALSE, fL = param$fL, ...) : Ze

0热度

2回答

高斯NB拟合（）函数期望固定长度向量

我想实现像这样的高斯NB训练。然而，如果X的尺寸不相等（即X内的所有列表需要长度相同），则gnb.fit（）会引发异常。如果我的训练样本是不同长度的向量，调用fit（）的正确方法是什么？ def train(X, Y): gnb = GaussianNB() gnb.fit(X, Y) return gnb >>> X = [[1,2,3], [4,5,6,7],

0热度

1回答

CountVectorizer MultinomialNB ValueError：尺寸不匹配

我想让我的MultinomialNB工作。我在训练和测试集上使用CountVectorizer，当然两个setz中都有不同的词。所以我看到，为什么错误发生，但我不知道如何解决它。我试图CountVectorizer().transform，而不是作为CountVectorizer().fit_transform在其他职位（SciPy and scikit-learn - ValueError: D

0热度

1回答

Postgres的-马德利布预测花费的时间比训练

我使用下面的代码训练我的数据： start_time := clock_timestamp(); PERFORM madlib.create_nb_prepared_data_tables('nb_training', 'class', 'attributes', 'ARRAY[1,2,3,4

0热度

1回答

[Python的] sklearn朴素贝叶斯

I write python code like this train_x, test_x, train_y, test_y = train_test_split(x, y, random_state=33, train_size=0.7) #lsvc=LinearSVC() #lsvc.fit(train_x, train_y) #y_predict=lsvc.predict(tr