我真的是编程的初学者,而且我遇到了一个问题。我正在对假新闻和真实新闻进行比较分析。我有一个aprox文本语料库。 3000条真实新闻和3000条假新闻。我需要弄清楚虚假或真实的新闻是否会唤起更高的唤起情绪。我想通过使用Warriner et。人。单词列表:http://crr.ugent.be/archives/1003情绪分析 - 觉醒
我已经导入单词列表给我的脚本:
warriner = pd.read_csv('warriner.csv', sep = '\t', encoding = 'utf-8')
print warriner.head()
我(想,我)想找到觉醒平均总和,这在单词列表被称为A.Mean.Sum
。但我不能让它工作,Spyder
只是说:'DataFrame'对象没有属性'A'。 任何人都可以帮忙吗?我已经通过使用LabMT
来计算情绪分数,如下所示,但我无法让Warringer等人的工作。
text_scored = [] for text in df['text']: sent_score = tm.labMT_sent(text)
text_scored.append(sent_score)
df['abs_sent'] = text_scored #adding the scored text to the df
相对景气指数
text_scored = [] for text in df['text']: sent_score = tm.labMT_sent(text, rel = True)
text_scored.append(sent_score)
df['rel_sent'] = text_scored #adding the scored text to the df
overall mean
df['abs_sent'].mean() df['abs_sent'].loc[df['label'] == 'FAKE'].mean()
#'fake' mean = - 22,1 df['abs_sent'].loc[df['label'] == 'REAL'].mean()
#'real' mean = - 41,95
相对评分平均计算
df['rel_sent'].mean() #overall mean df['rel_sent'].loc[df['label'] == 'FAKE'].mean()
#'fake' mean = - 0,02 df['rel_sent'].loc[df['label'] == 'REAL'].mean()
#'real' mean = - 0,05