我正试图实施naïvebayes算法来对mahout中的tweet和facebook数据进行情感分析。我在文本文件中提供了这些推文和facebook数据。我使用的命令转换这些文件中,以序列文件将序列文件转换为向量
仓/亨利马乌seqdirectory -i /用户/ hadoopUser /样品/输入-o /用户/ hadoopUser /样品/ seqoutput
,然后我试图转换到载体序列文件,为了给输入用命令亨利马乌
仓/亨利马乌seq2sparse -i /用户/ hadoopUser /样品/ seqoutput -o /用户/ hadoopUser/vectoroutput -OW -a org.apache。 lucene.analysis.WhitespaceAnalyzer -chunk 200 -wt tfidf -s 5 -md 3 -x 90 -ng 2 -ml 50 -seq
这是将整个文档转换为到矢量,但我想将每个句子转换为矢量,因为我不想对文档进行分类。我想分类文件中的评论。任何人都可以帮我解决这个问题吗?