sentiment-analysis

2热度

1回答

我正在研究我的机器学习模型和我拥有的数据的功能。我的数据包含很多文本数据，所以我想知道如何从中提取有价值的功能。相反，我以前的信仰，这往往是由表示与袋的字，或像word2vec：（http://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction）因为我对这个问题的理解是有限的，我不明白为什

0热度

1回答

如何解决以下错误？输入必须是任意长度的字符向量或字符向量列表，其中每个长度都为1.

我正在开发一个R项目。我使用的数据集在以下链接处可用 https://www.kaggle.com/ranjitha1/hotel-reviews-city-chennai/data 我已经使用的代码是。 df1 = read.csv("chennai.csv", header = TRUE) library(tidytext) tidy_books <- df1 %>% unnest_tok

-5热度

1回答

如何使用python计算精度，召回率和F分数？

labelTrainData.csv用于训练分类器以预测Testdata.csv的情感。最后我得到了BagOfCentroids.csv。 labelTrainData.csv id sentiment Tweet 1 0 tweet_1 2 1 tweet_2 3 0 tweet_3 Testdata.csv id Tweet 1 tweet_1 2 tweet_

0热度

1回答

如何做在的R中的情感分析替代转推条目GSUB（）函数帮助

Tgus代码展示了如何从鸣叫转推选项情感分析的情况下，R. tweets <- searchTwitter("iPhone", n=1500, lang="en") txt <- sapply(tweets, function(x) x$getText()) txt <- gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", txt) 我也不是什么不解的是，在gs

0热度

1回答

通过tensorflow实现TFlearn imdb lstm示例

通过张量流实现tflearn的lstm imdb example。我使用了与tflearn模型相同的数据集，体系结构和超参数（嵌入大小，句子的最大长度等），但是我的模型的性能比tflearn示例差（10个历元后，我的模型得到了精度约为52％，而实例接近80％）。如果您能给我一些建议以达到示例的适当性能，我会非常感激。下面是我的代码： import tensorflow as tf from

2热度

1回答

Tensorflow lstm用于情感分析而不学习。已更新

已更新：我正在为我的最终项目建立一个神经网络，我需要一些帮助。我正在尝试构建一个rnn来对西班牙文本进行情感分析。我有20万左右标记的鸣叫，我使用word2vec与西班牙嵌入数据集&矢量矢量其中：我删除重复和分裂成集训练和测试集。向量化时应用填充，未知和句子结束标记。我将@mentions映射到word2vec模型中的已知名称。例如：@iamthebest => “约翰” 我的模型：

0热度

1回答

如何在R中使用SentimentAnalysis包？我，我和LM的含义是什么？

任何人都可以在R中的SentimentAnalysis包中解释GI，HE，LM，QDAP的含义吗？如果我们看一下上面提到的每一个列，给出多个答案，使用这个包来识别一个句子的极性的最好方法是什么？

0热度

1回答

R中的Stemmer函数慢

我试图在R约40000行的数据集上运行stemmer函数（通过data.table包上传），但它需要永久运行。我的代码如下所示： data[, Description := map(Description, function(k) stemmer(k))] 如果手动停止的过程中，它显示超过50级的警告为： Image Link 是否有更快的运行它的替代品。我的电脑有8Gb内存。

-2热度

1回答

可以收集多少推文？

我是Twitter API的初学者。我将为我的论文进行情绪分析。所以我需要尽可能多的来自Twitter的数据（用户的评论）。但是，我听说Twitter的政策去年发生了变化。它的政策限制了用户收集大量数据。所以我想知道可以收集多少鸣叫（例如5000数据）。因为如果他们限制我的访问令牌，那么我必须改变它。另外，我不知道它们限制了我的访问令牌或IP地址。我使用Python与Anaconda，程序将在

1热度

1回答

基于词典的情感分析的准确性

我对我已经获取的一组Twitter数据执行不同的情感分析技术。它们基于词典（Vader Sentiment和SentiWordNet），因此不需要预先标记的数据。我想知道是否有方法（如F-Score，ROC/AUC）来计算分类器的准确性。我所知道的大多数方法都需要一个目标来比较结果。