2009-07-28 89 views
10

我在玩情绪分析,我正在寻找一些种子数据。有免费字典吗?情绪分析的种子数据

它可以非常简单:3组文本/句子,用于“正面”,“负面”,“中性”。它不一定非常庞大。

最终,我可能会为我的具体用例生成我自己的种子数据,但在构建这个东西的时候,现在有一些东西可以用来玩。

+0

我的冰雷和闽清县胡集(从亚马逊的约9个产品的约7000评论。com)我把它们放在一张Excel Sheet中,每个人的综合平均分数。 我还从网络(ViralHeat,AlchemyAPI,repustate API)添加了3种不同的免费情绪分析API的分数 如果您需要Excel Sheet,我可以将它提供给您。 – SKandeel 2011-10-31 07:45:43

+1

http://www.cs.uic.edu/~liub/FBS/sentiment-analysis.html#lexicon – zengr 2013-03-05 10:05:11

+0

@SherifMaherEaid:你如何从文章创建你自己的词典? – user123 2013-08-20 17:40:12

回答

3

如果您对情感词典感兴趣,许多作者都提供了基于手动构建列表的工作以及其他用于获得自由词汇列表的半自动方法。一种好的方法是使用WordNet数据库,通过使用像同义词等关系来扩展正面/负面词的核心。

手动构建列表的一个很好的例子是General Inquirer

对于派生列表的半自动方法,请查看Esuli和Sebastiani的SentiWordNet

这些我相信通常可用于研究,但您可能需要与作者联系,以便将这些资源用于非研究目的。

B.

1

您可以使用这里的AFINN单词列表:

http://www2.imm.dtu.dk/pubdb/views/publication_details.php?id=6010

AFINN是英文单词额定价带之间的整数 列表减五(负)并加上五(正面)。 2009年至2011年,FinnÅrupNielsen手动标记了 。该文件是以制表符分隔的 。有两个版本:

AFINN-111:带2477个单词和短语的最新版本。

AFINN-96:1468行1468个独特的单词和短语。请注意,有 是1480行,因为有些单词列出了两次。单词列表中不是 完全按字母顺序排列。