naivebayes

    1热度

    1回答

    我现在正在通过一本关于机器学习的书来自己工作。 在NaiveBayesClassifier笔者的工作是赞成cross-validation method 非常多,他建议将数据分割成十桶(文件),每次扣不同的桶上九他们训练。 到目前为止,我所熟悉的唯一方法是将数据拆分为training set和test set,比率为50%/50%,并简单地一次训练分类器。 有人可以解释什么是使用交叉验证可能的优势

    4热度

    1回答

    我一直在CRAN上寻找一个多项式朴素贝叶斯分类器,到目前为止,我能想出的是包e1071中的二项式实现。有人知道一个包含多项Bayes分类器的软件包吗?

    1热度

    1回答

    我正在实现一个朴素的朴素贝叶斯分类器,但我不明白如何正确计算类的条件概率(P(d | c))。为了完整起见,我很快想解释使用的术语。朴素贝叶斯概率由计算: c表示的任意类,而d是一个文件。令x = {x 1,x 2,...,x n}是n个特征的列表,例如50个最常见的bigrams)。 在我的训练集中,有一个类(由一个名为c_i的文件夹表示),每个类都有k个文档(由普通文本文件表示)。 的先验概率

    1热度

    1回答

    我想分析在线代码并希望使用贝叶斯分类。不过,我需要相当数量的预先分类代码作为样本数据。 也许是二十左右的顶尖语言? 有谁知道这样的语料库?

    0热度

    1回答

    我正在尝试使用朴素贝叶斯文本分类器的文本分类。 我的数据是以下格式,并根据问题和摘录我必须决定问题的主题。培训数据有超过20K条记录。我知道SVM在这里会更好,但我想用Naive Bayes using sklearn library。 {[{"topic":"electronics","question":"What is the effective differencial effective

    1热度

    1回答

    我运行一个朴素贝叶斯模型,并使用klaR直接包是非常快的,不到一秒钟来计算在标准的笔记本电脑: mod <- NaiveBayes(category ~ ., data=training, na.action = na.omit) 但是,使用caret包的train()接口 - 我认为是单纯的为了上述功能的包装 - 需要花费很长的时间: mod <- train(category ~ ., dat

    1热度

    1回答

    我正在研究如何从文档中提取关键短语作为我的论文。 在我的研究中,我使用朴素贝叶斯分类器机器学习来创建候选术语特征的训练模型。其中一个特性是PoS标签,我认为这个特性对于指定一个术语是否是keyphrase非常重要。 但是输入朴素贝叶斯(NB)分类器是数字和PoS标记是一个字符串。 所以我不知道将PoS标签特征表示为数字以便成为NB分类器的输入特征的方式。 请帮我给你的建议。 感谢和问候, HIEN

    1热度

    1回答

    我只是试图用naiveBayes函数在e1071包中。这里是过程: >library(e1071) >data(iris) >head(iris, n=5) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2

    0热度

    1回答

    我创建了一个使用countvectorizer和MultinomialNB的管道对象。 MultinomialNB实例具有名为intercept_的属性。如果我尝试使用管道对象访问此属性,则会收到“管道”对象没有属性“intercept_”的错误。我想知道是否有方法来访问Pipeline实例中最终估计器类的属性。我想提前感谢。

    1热度

    1回答

    我们可以使用朴素贝叶斯分类数值数据。我们有一个系统提取作者的风格,如句子长度,字长,并用它来预测匿名文档的作者身份。因此,我们可以使用朴素贝叶斯根据这些数字数据对作者进行分类。否则你能否提出一个更好的选择。