2015-03-19 66 views
1

我有100个学生的四节课的数据集(例如,课a,课b,课c,课d),让我们想象这个等级与 课程的等级相关联。幼稚bayes预测分数

我想通过那四年级来实现朴素贝叶斯预测成绩课f,但我不知道如何使用输入。 我读了朴素贝叶斯垃圾邮件检测,并在此,每个字的可能性计算。 但是对于等级我不知道我必须计算的可能性。 我已经尝试过垃圾邮件,但是对于这个例子,我只有四个名字(每个课程)

+0

欢迎来到本网站。本指南可以帮助您简化您当前非常广泛的问题:[问]。 – mins 2015-03-19 06:33:09

回答

1

为了做出好的分类,您需要有一些关于学生的信息,而不是他们正在上课。以你的例子为例,垃圾邮件检测是基于单词,停止通常是垃圾邮件(购买,促销,金钱)或来源于http头文件。 对于预测学生成绩的情况,你可以想像有关于学生的信息:社交课,他是做运动,男性还是女性,等等。

回到你的问题,这不是有趣的课程名称,而是每个学生在课堂上的成绩。你需要对每四堂课和f课进行评分,以训练朴素贝叶斯分类器。

你的条目可能看起来像:

StudentID gradeA gradeB gradeC gradeD gradeF 
1    10  9  8   5   8 
2    3  5  3   8   8 
3    5  3  1   1   2 
4    10  10  10  5   4 

训练你的分类后,你将通过新进入一个新的学生那样:

StudentID gradeA gradeB gradeC gradeD 
1058   1  5  8   4 

分类器将能够预测档次对于F课,考虑到了先前的成绩。

您可能已经注意到,我打算在gradeF与gradeD高度相关的情况下做了一个训练数据集。这就是贝叶斯分类器试图学习的内容,只是以更复杂的方式。