需要一些与火花音乐上的音乐情绪分析有关的指导。与音乐相关的Twitter数据的情感分析功能
我试图在Twitter数据进行情感分析相关音乐鸣叫。经过大量网络搜索之后,我了解了如何使用'tweepy'python api获取推文,并且意识到我可以使用'朴素贝叶斯分类器'来最终对推文进行分类。现在我对如何定义这个分类的特征感到困惑,我应该定义至少500个特征。所以这是我的问题。我不想使用像'textblob'这样已经可用的API来查找推文的情绪。
1)任何人都可以给的,我们可以使用分类音乐相关的微博功能的一些例子吗? [我们可以使用带有快乐笑脸的tweet作为正面训练集吗?如果有,这些鸣叫功能的话对我的分类?]
2)我们如何生成此分类的训练集?
3)如果我要筛选音乐相关的鸣叫鸣叫,我可以用布隆过滤器来实现呢?
4)什么是数据我可以通过tweepy API获得的大小呢?
如果我的理解有问题,请纠正我。