2009-07-04 110 views
7

看起来最简单,最天真的做基本情绪分析的方法是用贝叶斯分类器(通过我在这里找到的证实证实)。任何反驳或其他建议?简单的情绪分析

回答

11

贝叶斯分类器与一袋词表示法是最简单的统计方法。通过转向更高级的分类器和特征表示,您可以获得更好的结果,但代价是更复杂。

统计方法不是镇上唯一的游戏。另一个主要选择是基于规则的方法,对文本结构有更多的理解。从我所看到的,这些实际上并不像统计方法那么好。

我推荐Manning和Schütze的统计自然语言处理基础第16章,文本分类。

5

我想不出一种更简单,更幼稚的方式进行情感分析,但是您可能会考虑使用支持向量机而不是朴素贝叶斯(在某些机器学习工具包中,这可能是一种直接替换) 。看一看"Thumbs up? Sentiment Classification using Machine Learning Techniques" by Bo Pang, Lillian Lee, and Shivakumar Vaithyanathan这是关于这些技术的最早的论文之一,并且给出了一系列相关技术的精确度结果的良好表格,但其中没有一个比其他任何更复杂(从客户角度来看)。

+0

这是一个不错的开始。后来,彭和李又有一篇文章稍微有点不同,以获得更好的结果。试试这个: http://www.aclweb.org/anthology-new/P/P04/P04-1035.pdf – mixdev 2010-07-02 09:56:04

1

大厦经上述肯提供的答案,还有另一篇论文

由托尼和尼日尔“支持向量机与不同的信息源情绪分析”,

看起来比它分配更多的功能彭和李使用的一袋字。在这里,他们利用wordnet来确定形容词的语义差异,并将文本中主题的情感接近度作为SVM的附加特征。它们比之前基于情绪分类文本的尝试显示出更好的结果。