我正在做一个关于twitter情绪分析的项目,但是我有一些想法。Twitter的情绪分析技术
由于推文非常短(少于140个字符),文本分析技术最适用的是什么。例如。是否会干扰工作以及在-let的常规文章中?
n-grams呢?推文的简短程度对他们来说是最好的还是最差的?
k-nearest会比词性标记更准确吗?
随着时间的推移,我的自定义twitter数据集会变得不相关/损坏吗?由于twitter和它的信息变化如此之快,这也是我主要关心的问题。
非常感谢您的时间。
PS:你有什么好的twitter情绪数据集?如果定期更新会很好。
[sentiment140.com有技术报告](http://help.sentiment140.com/)描述了他们的方法。它似乎源于同一个作业。下面是一个例子:[使用'stackoverflow'的推文的情感分析](http://www.sentiment140.com/search?hl = zh_CN&query = stackoverflow) – jfs