naivebayes

1热度

1回答

我现在正在通过一本关于机器学习的书来自己工作。在NaiveBayesClassifier笔者的工作是赞成cross-validation method 非常多，他建议将数据分割成十桶（文件），每次扣不同的桶上九他们训练。到目前为止，我所熟悉的唯一方法是将数据拆分为training set和test set，比率为50%/50%，并简单地一次训练分类器。有人可以解释什么是使用交叉验证可能的优势

4热度

1回答

多项式朴素贝叶斯分类器

我一直在CRAN上寻找一个多项式朴素贝叶斯分类器，到目前为止，我能想出的是包e1071中的二项式实现。有人知道一个包含多项Bayes分类器的软件包吗？

1热度

1回答

NaiveBayes分类器：我必须连接一个类的所有文件吗？

我正在实现一个朴素的朴素贝叶斯分类器，但我不明白如何正确计算类的条件概率（P（d | c））。为了完整起见，我很快想解释使用的术语。朴素贝叶斯概率由计算： c表示的任意类，而d是一个文件。令x = {x 1，x 2，...，x n}是n个特征的列表，例如50个最常见的bigrams）。在我的训练集中，有一个类（由一个名为c_i的文件夹表示），每个类都有k个文档（由普通文本文件表示）。的先验概率

1热度

1回答

我在哪里可以找到大样本的计算机语言朴素贝叶斯分析

我想分析在线代码并希望使用贝叶斯分类。不过，我需要相当数量的预先分类代码作为样本数据。也许是二十左右的顶尖语言？有谁知道这样的语料库？

0热度

1回答

如何使用sklearn库进行朴素贝叶斯文本分类？

我正在尝试使用朴素贝叶斯文本分类器的文本分类。我的数据是以下格式，并根据问题和摘录我必须决定问题的主题。培训数据有超过20K条记录。我知道SVM在这里会更好，但我想用Naive Bayes using sklearn library。 {[{"topic":"electronics","question":"What is the effective differencial effective

1热度

1回答

速度差异，因为朴素贝叶斯

我运行一个朴素贝叶斯模型，并使用klaR直接包是非常快的，不到一秒钟来计算在标准的笔记本电脑： mod <- NaiveBayes(category ~ ., data=training, na.action = na.omit) 但是，使用caret包的train()接口 - 我认为是单纯的为了上述功能的包装 - 需要花费很长的时间： mod <- train(category ~ ., dat

1热度

1回答

如何使用PoS标签作为Naive Bayes分类器训练数据的特征？

我正在研究如何从文档中提取关键短语作为我的论文。在我的研究中，我使用朴素贝叶斯分类器机器学习来创建候选术语特征的训练模型。其中一个特性是PoS标签，我认为这个特性对于指定一个术语是否是keyphrase非常重要。但是输入朴素贝叶斯（NB）分类器是数字和PoS标记是一个字符串。所以我不知道将PoS标签特征表示为数字以便成为NB分类器的输入特征的方式。请帮我给你的建议。感谢和问候， HIEN

1热度

1回答

使用naiveBayes预测类变量

我只是试图用naiveBayes函数在e1071包中。这里是过程： >library(e1071) >data(iris) >head(iris, n=5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2

0热度

1回答

在scikit学习中，是否可以使用管道对象的最终估计器的属性？

我创建了一个使用countvectorizer和MultinomialNB的管道对象。 MultinomialNB实例具有名为intercept_的属性。如果我尝试使用管道对象访问此属性，则会收到“管道”对象没有属性“intercept_”的错误。我想知道是否有方法来访问Pipeline实例中最终估计器类的属性。我想提前感谢。

1热度

1回答

使用朴素贝叶斯数字属性

我们可以使用朴素贝叶斯分类数值数据。我们有一个系统提取作者的风格，如句子长度，字长，并用它来预测匿名文档的作者身份。因此，我们可以使用朴素贝叶斯根据这些数字数据对作者进行分类。否则你能否提出一个更好的选择。