我有100个学生的四节课的数据集(例如,课a,课b,课c,课d),让我们想象这个等级与 课程的等级相关联。幼稚bayes预测分数
我想通过那四年级来实现朴素贝叶斯预测成绩课f,但我不知道如何使用输入。 我读了朴素贝叶斯垃圾邮件检测,并在此,每个字的可能性计算。 但是对于等级我不知道我必须计算的可能性。 我已经尝试过垃圾邮件,但是对于这个例子,我只有四个名字(每个课程)
我有100个学生的四节课的数据集(例如,课a,课b,课c,课d),让我们想象这个等级与 课程的等级相关联。幼稚bayes预测分数
我想通过那四年级来实现朴素贝叶斯预测成绩课f,但我不知道如何使用输入。 我读了朴素贝叶斯垃圾邮件检测,并在此,每个字的可能性计算。 但是对于等级我不知道我必须计算的可能性。 我已经尝试过垃圾邮件,但是对于这个例子,我只有四个名字(每个课程)
为了做出好的分类,您需要有一些关于学生的信息,而不是他们正在上课。以你的例子为例,垃圾邮件检测是基于单词,停止通常是垃圾邮件(购买,促销,金钱)或来源于http头文件。 对于预测学生成绩的情况,你可以想像有关于学生的信息:社交课,他是做运动,男性还是女性,等等。
回到你的问题,这不是有趣的课程名称,而是每个学生在课堂上的成绩。你需要对每四堂课和f课进行评分,以训练朴素贝叶斯分类器。
你的条目可能看起来像:
StudentID gradeA gradeB gradeC gradeD gradeF
1 10 9 8 5 8
2 3 5 3 8 8
3 5 3 1 1 2
4 10 10 10 5 4
训练你的分类后,你将通过新进入一个新的学生那样:
StudentID gradeA gradeB gradeC gradeD
1058 1 5 8 4
分类器将能够预测档次对于F课,考虑到了先前的成绩。
您可能已经注意到,我打算在gradeF与gradeD高度相关的情况下做了一个训练数据集。这就是贝叶斯分类器试图学习的内容,只是以更复杂的方式。
欢迎来到本网站。本指南可以帮助您简化您当前非常广泛的问题:[问]。 – mins 2015-03-19 06:33:09