naivebayes

4热度

1回答

我从头开始实现多项朴素贝叶斯分类器以用于python中的文本分类。我计算每个类的特征计数和特征的概率分布。据我实现我得到如下结果：假设我有以下的文集： corpus = [ {'text': 'what is chat service?', 'category': 'what_is_chat_service'}, {'text': 'Why should I us

1热度

1回答

R NaiveBayes问题与数字变量

即使NaiveBayes（）帮助说数字可以在第一个参数'x'中传递，我无法成功地运行它。没有数字变量（转售）它工作正常。下面是脚本： library(readr) library(klaR) ### load dataset Dataset <- read_csv("D:/sampledata.csv") ### converting 'model' and

0热度

1回答

培训和测试集拆分

我想实现数据集划分到培训和测试集，但在从第45行开始的功能我遇到了问题。 “KeyError异常：667952”运行，具有程序返回后（在错误的数量我每次运行的程序是不同的） 1 import numpy as np 2 import pandas as pd 3 import random 4 5 data_file = pd.read_csv('loan.csv') 6 7 # va

1热度

1回答

TextBlob朴素贝叶斯。选择最高可能性

作为训练数据，都餐馆中XML的评价，与相关联的目标表达的情感被朝向表达，一个类别，它是离散的标签这属于和极性朝向此表示： <text>With the great variety on the menu , I eat here often and never get bored .</text> <Opinions> <Opinion target="menu" categ

0热度

1回答

Bigram分析和术语文档矩阵

我正在对我的文本语料库进行bigram分析。我的特征向量是一组预定义的bigram和unigram令牌。特征向量 =（地理位置好，坏的经验，干净，友善，整洁，优良的，美丽的地方）我的文字：位置好，但不友好的工作人员。清理文字：位置好不友好的工作人员。我使用上面的字典和清理文本创建了一个tdf，但“位置好”的bigram没有给出“1”。但是，当我将清理后的文本更改为“位置不友好的员工”时。

0热度

1回答

多个朴素贝叶斯分类器

我正在寻找执行审查网站的Naive Byes分类器以识别垃圾评论并且有几个问题。它有多种类型的垃圾邮件，如直接营销垃圾与无关，他们正在评估的东西，对欺骗性的审查发生在我身上。为不同的目的实施多个分类器是明智的做法，这样才能更好地检测一般的垃圾邮件，而另一方则了解欺骗性评论？在一个类似的徒劳，有多个类别的项目正在审查，所以对于“欺骗性审查”分类器，最好是只有一个分类器，试图从所有评论学习？或者是

0热度

1回答

R NaiveBayes分类器不会将类型读为“公式”

我在klaR软件包中使用NaiveBayes函数，出于某种原因，该函数不会将公式输入参数读取。我知道NaiveBayes函数有两种方法，一种是“默认”，另一种是“公式”的输入类。当我运行NaiveBayes函数时，它会将我的输入公式读取为默认类型，并引发错误。我的代码如下： trainData <- read.csv("train.txt") trainNB <- NaiveBayes(Type

2热度

2回答

org.apache.spark.sql.AnalysisException：无法从概率

我使用朴素贝叶斯算法进行分类文章获取价值，并希望访问的部分结果的“概率”列： val Array(trainingDF, testDF) = rawDataDF.randomSplit(Array(0.6, 0.4)) val ppline = MyUtil.createTrainPpline(rawDataDF) val model = ppline.fit(training

0热度

1回答

朴素贝叶斯模型（.pkl）花费太多时间来预测

我使用朴素贝叶斯算法预测句子的情绪。我正在创建一个未来使用的模型。我正在使用cpickle来保存模型。但是，当我加载和预测句子时，花费太多时间。它花费太多时间来加载.pkl文件大约是100MB。有3种型号。我在python中使用Flask微服务。因此，对于每个请求每个模型（.pkl）是负载，并给输出。每个请求大约需要30-45秒。 def predict(sentence): test

1热度

2回答

文本分析 - 无法在csv或xls文件中编写Python程序的输出

您好我正在尝试使用python 2.x中的Naive Bayes分类器进行情感分析。它使用txt文件读取情绪，然后根据示例txt文件情绪给出正面或负面的输出。我希望输出与输入相同，例如我有一个文本文件让我们可以看到1000条原始情绪，我希望输出对每个情绪都显示正面或负面。请帮忙。下面是我使用 import math import string def Naive_Bayes_Class