我目前正在进行情绪分析项目,第一次将使用推文作为输入。这些推文的主题是体育,目前我正在预处理数据并试图为它们分配极性。通过将这些情感计数的许多不同的方式是混淆了我一点,因此我有一些问题: 这个线程(Training data for sentiment analysis)列表中的一些语料库,但他们都不适用于运动。我可以使用其中之一来训练适用于我的病例的分类器吗?或者是否会使用不相关的语料库来歪曲结
我使用Vader和TextBlob分析,结果好坏参半新闻标题的感悟:很多头条,我会考虑稍微负的评分为中性。下面是几个例子: Who wants to live in an artificially intelligent future?
# Vader: {'compound': 0.4588, 'pos': 0.273, 'neu': 0.727, 'neg': 0.0}
# TextBlo