2016-06-10 79 views
0

我使用Mahout中检索名为向量的名称错误的k-means含12份文件与下面的命令的帮助目录集群:Mahout的集群:在使用seqdumper

mahout seq2sparse -i /user/manisha1414/dir_001-seqfiles -o /user/manisha1414/dir_001-vectors --maxDFPercent 85 --namedVector 
mahout seqdumper -i /user/manisha1414/dir_001-kmeans-clusters/clusteredPoints/part-m-00000 > ./dir_001-cluster-docs.txt 

我收到以下输出

Key: 0: Value: wt: 1.0 distance: 47.44299700930014 vec: [{"0":2.386},{"2":1.875},{"9":2.386},{"14":2.386......... 
Key: 11: Value: wt: 1.0 distance: 217.4603558919857 vec: [{"0":2.386},{"2":1.875},{"......... 

我不是在上面的输出得到向量的IDS。

请帮我在输出中获得vector-ids!

回答

0

将序列文件转换为向量时使用“--namedVector true”。