我正在研究我的机器学习模型和我拥有的数据的功能。我的数据包含很多文本数据,所以我想知道如何从中提取有价值的功能。相反,我以前的信仰,这往往是由表示与袋的字,或像word2vec:(http://scikit-learn.org/stable/modules/feature_extraction.html#text-feature-extraction)使用文本情感作为机器学习模型中的功能?
因为我对这个问题的理解是有限的,我不明白为什么我不能对文本进行分析首先要获取数值。 (例如:textBlob.sentiment = https://textblob.readthedocs.io/en/dev/,谷歌云自然语言= https://cloud.google.com/natural-language/)
是否有这个问题,我也可以使用这些值作为拥有我的机器学习模型?
在此先感谢您的帮助!
感谢您的回复!这很有道理,谢谢。我正在根据youtube,twitter和facebook的用户数据制作预测电影票房成功的模型。我会说,情绪是一个有价值的功能。此外,对我而言,集群文本是否也适用? – Lourens
不,您的问题不是聚类,而是回归或分类任务基于您如何衡量成功。我认为情绪分析可以解决你的问题。因为,如果用户评论对电影的肯定而不是票房真的很成功,反之亦然。 –