2017-10-04 210 views
0

我创建了两个不同的集群,一个使用kmeans(分区方法),另一个使用完全链接(分层)。Stata中的散点集群12

使用分层方法中的簇:

cluster completelinkage area age, name(hcm_5) measure(L2) 
cluster generate c1 = group(5), name(hcm_1) 

使用分区方法簇:

cluster kmeans area age, k(5) name(pcm_1) 

这产生两种不同的集群。现在我想直观地看到创建的集群。我想分散一下,并根据pcm_1和c1的值使其显示不同的颜色。但是,我只能为一个语句创建分散检查。

例:

scatter ycoord xcoord if pcm_1==1, mcolor(red) 
scatter ycoord xcoord if pcm_1==2, mcolor(green) 
... 
scatter ycoord xcoord if pcm_1==5, mcolor(purple) 

我如何获得这些散落在同一个曲线图,根据每个观测变量的值不同的颜色?

回答

1

这是如何做到这一点的基本思想:

ssc install labutil 
sysuse auto 
separate price , by(rep78) gen(price_) 
labvarch price_*, after("== ") 
tw scatter price_* weight 
drop price_* 

如果您存储在自己的变量中的每个集群的y值,这使得它更容易在一次绘制它们。

你也可以做到这一点的手就像这样:

tw (scatter price weight if rep78==1) (scatter price weight if rep78==2) (scatter price weight if rep78==3) (scatter price weight if rep78==4) (scatter price weight if rep78==5) 
+0

'单独的价格,由(Rep78的)根(price_)veryshortlabel'呈现'labvarch'冗余这里。记录在http://www.stata-journal.com/sjpdf.html?articlenum=gr0023 –