naivebayes

    4热度

    1回答

    我从头开始实现多项朴素贝叶斯分类器以用于python中的文本分类。 我计算每个类的特征计数和特征的概率分布。 据我实现我得到如下结果: 假设我有以下的文集: corpus = [ {'text': 'what is chat service?', 'category': 'what_is_chat_service'}, {'text': 'Why should I us

    1热度

    1回答

    即使NaiveBayes()帮助说数字可以在第一个参数'x'中传递,我无法成功地运行它。没有数字变量(转售)它工作正常。下面是脚本: library(readr) library(klaR) ### load dataset Dataset <- read_csv("D:/sampledata.csv") ### converting 'model' and

    0热度

    1回答

    我想实现数据集划分到培训和测试集,但在从第45行开始的功能我遇到了问题。 “KeyError异常:667952”运行,具有程序返回后(在错误的数量我每次运行的程序是不同的) 1 import numpy as np 2 import pandas as pd 3 import random 4 5 data_file = pd.read_csv('loan.csv') 6 7 # va

    1热度

    1回答

    作为训练数据,都餐馆中XML的评价,与相关联的目标表达的情感被朝向表达,一个类别,它是离散的标签这属于和极性朝向此表示: <text>With the great variety on the menu , I eat here often and never get bored .</text> <Opinions> <Opinion target="menu" categ

    0热度

    1回答

    我正在对我的文本语料库进行bigram分析。我的特征向量是一组预定义的bigram和unigram令牌。 特征向量 =(地理位置好,坏的经验,干净,友善,整洁,优良的,美丽的地方) 我的文字:位置好,但不友好的工作人员。 清理文字:位置好不友好的工作人员。 我使用上面的字典和清理文本创建了一个tdf,但“位置好”的bigram没有给出“1”。 但是,当我将清理后的文本更改为“位置不友好的员工”时。

    0热度

    1回答

    我正在寻找执行审查网站的Naive Byes分类器以识别垃圾评论并且有几个问题。 它有多种类型的垃圾邮件,如直接营销垃圾与无关,他们正在评估的东西,对欺骗性的审查发生在我身上。为不同的目的实施多个分类器是明智的做法,这样才能更好地检测一般的垃圾邮件,而另一方则了解欺骗性评论? 在一个类似的徒劳,有多个类别的项目正在审查,所以对于“欺骗性审查”分类器,最好是只有一个分类器,试图从所有评论学习?或者是

    0热度

    1回答

    我在klaR软件包中使用NaiveBayes函数,出于某种原因,该函数不会将公式输入参数读取。我知道NaiveBayes函数有两种方法,一种是“默认”,另一种是“公式”的输入类。当我运行NaiveBayes函数时,它会将我的输入公式读取为默认类型,并引发错误。我的代码如下: trainData <- read.csv("train.txt") trainNB <- NaiveBayes(Type

    2热度

    2回答

    我使用朴素贝叶斯算法进行分类文章获取价值,并希望访问的部分结果的“概率”列: val Array(trainingDF, testDF) = rawDataDF.randomSplit(Array(0.6, 0.4)) val ppline = MyUtil.createTrainPpline(rawDataDF) val model = ppline.fit(training

    0热度

    1回答

    我使用朴素贝叶斯算法预测句子的情绪。我正在创建一个未来使用的模型。我正在使用cpickle来保存模型。但是,当我加载和预测句子时,花费太多时间。它花费太多时间来加载.pkl文件大约是100MB。有3种型号。我在python中使用Flask微服务。因此,对于每个请求每个模型(.pkl)是负载,并给输出。每个请求大约需要30-45秒。 def predict(sentence): test

    1热度

    2回答

    您好我正在尝试使用python 2.x中的Naive Bayes分类器进行情感分析。它使用txt文件读取情绪,然后根据示例txt文件情绪给出正面或负面的输出。 我希望输出与输入相同,例如我有一个文本文件让我们可以看到1000条原始情绪,我希望输出对每个情绪都显示正面或负面。 请帮忙。 下面是我使用 import math import string def Naive_Bayes_Class