使用mahout我能够分类数据的情绪。但是我陷入了一个混淆矩阵。Mahout的情绪分析
我使用象夫0.7朴素贝叶斯算法进行分类鸣叫的情绪。 我使用trainnb
和testnb
朴素贝叶斯分类器来训练分类器,并将推文的情感分为“正面”,“负面”或“中性”。
样品阳性训练集
'positive','i love my i phone'
'positive' , it's pleasure to have i phone'
的负 和中性同样地,我已经准备训练样本,它是一个巨大的数据集。
我提供的样本测试数据tweets没有包含情绪。
'it is nice model'
'simply fantastic '
我能够运行mahout分类算法,它将分类实例的输出作为混淆矩阵输出。
下一步,我需要找出哪些鸣叫都出现了积极的情绪和为负。 使用分类的预期输出:用情绪标记文本。
'negative','very bad btr life time'
'positive' , 'i phone has excellent design features'
在mahout中,我需要实现哪种算法以获得上述格式的输出。或者需要任何自定义源实现。
要显示的数据“好心”提示我说,阿帕奇象夫提供的算法,这将是适合我的Twitter数据的情感分析。