sentiment-analysis

    2热度

    1回答

    我正在研究我的机器学习模型和我拥有的数据的功能。我的数据包含很多文本数据,所以我想知道如何从中提取有价值的功能。相反,我以前的信仰,这往往是由表示与袋的字,或像word2vec:(http://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction) 因为我对这个问题的理解是有限的,我不明白为什

    0热度

    1回答

    我正在开发一个R项目。我使用的数据集在以下链接处可用 https://www.kaggle.com/ranjitha1/hotel-reviews-city-chennai/data 我已经使用的代码是。 df1 = read.csv("chennai.csv", header = TRUE) library(tidytext) tidy_books <- df1 %>% unnest_tok

    -5热度

    1回答

    labelTrainData.csv用于训练分类器以预测Testdata.csv的情感。最后我得到了BagOfCentroids.csv。 labelTrainData.csv id sentiment Tweet 1 0 tweet_1 2 1 tweet_2 3 0 tweet_3 Testdata.csv id Tweet 1 tweet_1 2 tweet_

    0热度

    1回答

    Tgus代码展示了如何从鸣叫转推选项情感分析的情况下,R. tweets <- searchTwitter("iPhone", n=1500, lang="en") txt <- sapply(tweets, function(x) x$getText()) txt <- gsub("(RT|via)((?:\\b\\W*@\\w+)+)", "", txt) 我也不是什么不解的是,在gs

    0热度

    1回答

    通过张量流实现tflearn的lstm imdb example。 我使用了与tflearn模型相同的数据集,体系结构和超参数(嵌入大小,句子的最大长度等),但是我的模型的性能比tflearn示例差(10个历元后,我的模型得到了精度约为52%,而实例接近80%)。 如果您能给我一些建议以达到示例的适当性能,我会非常感激。 下面是我的代码: import tensorflow as tf from

    2热度

    1回答

    已更新: 我正在为我的最终项目建立一个神经网络,我需要一些帮助。 我正在尝试构建一个rnn来对西班牙文本进行情感分析。我有20万左右标记的鸣叫,我使用word2vec与西班牙嵌入 数据集&矢量矢量其中: 我删除重复和分裂成集训练和测试集。 向量化时应用填充,未知和句子结束标记。 我将@mentions映射到word2vec模型中的已知名称。例如:@iamthebest => “约翰” 我的模型:

    0热度

    1回答

    任何人都可以在R中的SentimentAnalysis包中解释GI,HE,LM,QDAP的含义吗?如果我们看一下上面提到的每一个列,给出多个答案,使用这个包来识别一个句子的极性的最好方法是什么?

    0热度

    1回答

    我试图在R约40000行的数据集上运行stemmer函数(通过data.table包上传),但它需要永久运行。我的代码如下所示: data[, Description := map(Description, function(k) stemmer(k))] 如果手动停止的过程中,它显示超过50级的警告为: Image Link 是否有更快的运行它的替代品。我的电脑有8Gb内存。

    -2热度

    1回答

    我是Twitter API的初学者。我将为我的论文进行情绪分析。所以我需要尽可能多的来自Twitter的数据(用户的评论)。 但是,我听说Twitter的政策去年发生了变化。它的政策限制了用户收集大量数据。所以我想知道可以收集多少鸣叫(例如5000数据)。因为如果他们限制我的访问令牌,那么我必须改变它。另外,我不知道它们限制了我的访问令牌或IP地址。 我使用Python与Anaconda,程序将在

    1热度

    1回答

    我对我已经获取的一组Twitter数据执行不同的情感分析技术。它们基于词典(Vader Sentiment和SentiWordNet),因此不需要预先标记的数据。 我想知道是否有方法(如F-Score,ROC/AUC)来计算分类器的准确性。我所知道的大多数方法都需要一个目标来比较结果。