2017-08-09 132 views
-2

我真的是编程的初学者,而且我遇到了一个问题。我正在对假新闻和真实新闻进行比较分析。我有一个aprox文本语料库。 3000条真实新闻和3000条假新闻。我需要弄清楚虚假或真实的新闻是否会唤起更高的唤起情绪。我想通过使用Warriner et。人。单词列表:http://crr.ugent.be/archives/1003情绪分析 - 觉醒

我已经导入单词列表给我的脚本:

warriner = pd.read_csv('warriner.csv', sep = '\t', encoding = 'utf-8') 
print warriner.head() 

我(想,我)想找到觉醒平均总和,这在单词列表被称为A.Mean.Sum。但我不能让它工作,Spyder只是说:'DataFrame'对象没有属性'A'。 任何人都可以帮忙吗?我已经通过使用LabMT来计算情绪分数,如下所示,但我无法让Warringer等人的工作。

text_scored = [] for text in df['text']: sent_score = tm.labMT_sent(text) 
text_scored.append(sent_score) 
df['abs_sent'] = text_scored #adding the scored text to the df 

相对景气指数

text_scored = [] for text in df['text']: sent_score = tm.labMT_sent(text, rel = True) 
text_scored.append(sent_score) 
df['rel_sent'] = text_scored #adding the scored text to the df 
overall mean 

df['abs_sent'].mean() df['abs_sent'].loc[df['label'] == 'FAKE'].mean()  
#'fake' mean = - 22,1 df['abs_sent'].loc[df['label'] == 'REAL'].mean() 
#'real' mean = - 41,95 

相对评分平均计算

df['rel_sent'].mean() #overall mean df['rel_sent'].loc[df['label'] == 'FAKE'].mean() 
#'fake' mean = - 0,02 df['rel_sent'].loc[df['label'] == 'REAL'].mean() 
#'real' mean = - 0,05 

回答

2

您提供的示例代码是我很难阅读。您将问题报告为与A.Mean.Sum无关,但没有与此相关的代码。还有对Spyder和DataFrame的引用,没有解释,代码或标签。最后,标题应该告诉潜在的回答者关于问题本身的问题,而不是代码正在处理的一般字段。目前的人希望读者在报告中找到他们应该做的事情。

我很乐意承认我是一个新手,但我建议阅读介绍How-to-ask并用它来澄清你的问题。

我也猜这是一个pandas相关问题,所以它的文档页面可能会帮助你。

我希望我有任何帮助!