我想群集以下示例设置坐标:亨利马乌使用命令行来创建集群 - 问题
(1,1) , (2,1) , (1,2), (2,2), (3,3), (8,8), (8,9), (9,8), (9,9)
这些座标形成两个集群:
(1,1) , (2,1) , (1,2), (2,2), (3,3)
和
(8,8), (8,9), (9,8), (9,9)
这就是我如何进行:
步骤 1:在Hadoop存储在此作为在文件中的制表符分隔的数据为:
1 1
2 1
1 2
2 2
3 3
8 8
8 9
9 8
9 9
步骤 2:此文件转换成序列文件为:
$mahout seqdirectory --input my.data --output kdraft -c UTF-8
步骤 3:创建一个稀疏数据文件为:
$mahout seq2sparse -i kdraft -o kfinal -wt tf
步骤 4: 然冠层alogrithm生成集群为:
$mahout canopy -i kfinal/tf-vectors --clustering -o xz -t1 5 -t2 2 -ow
步骤 4:甩输出
输出出现在C。 txt为:
C-0 {n = 1 c = [4.000,2000,4000,4000,4000] r = []}重量:[道具 - 可选]:点: 1.0:[4.000,2000,4000,4000,4000 ]
我想知道哪个坐标在哪个簇?我没有得到它。