2013-08-27 32 views
2

我使用序列回归树检查职业轨迹中的差异。无论是在图中还是在树的打印说明中,都没有在TraMineR帮助菜单和Matthias Studer关于序列回归树/加权群集的论文中都没有解释的缩写。序列回归树中的缩写

能否请你让我知道什么该示例中的以下缩写低于平均值(超过15年的377名参与者分层进步(6个月的30个周期的每个)d-情节?非常感谢您!

打印输出

Dissimilarity tree: 
Parameters: minSize=18.85, maxdepth=3, R=5000, pval=0.01 
Formula: matOM ~ Age + Degree + Gender + YearsSinceGrad 
Global R2: 0.011589 

Fitted tree: 

|-- Root (n: 377 disc: 0.55559) 
    |-> Age 0.011589 
      |-- <= 48 with NA (n: 260 disc: 0.53812)[(1,20)-(2,8)-(3,2)] * 
      |-- > 48 (n: 117 disc: 0.57369)[(1,14)-(2,12)-(3,4)] * 

问题1:光盘=( - >等于S2中的情节,见下文) 问题2:[(1,20) - (2,8) - (3,2) ] * =?(这是最典型的序列吗?)

PLOTTED OUTPUT 问题3:s2 =? (在打印输出等于 “盘” 以上)enter image description here

enter image description here

回答

2

谢谢您的发言!

问题1:是的,'disc'='s2'在剧情中(我必须解决这个问题)。这意味着“差异”。差异很大意味着序列中有很多变化。差异的范围是[0,最大可能距离],因此不存在threashold值。但是你可以比较一些值。

Levene测试(在您的案例中似乎不重要,请参阅图像)测试差异差异的显着性。该测试可以使用dissassoc函数运行。在树中,Levene测试终端节点中差异的等同性(再次,这里差异似乎不显着)。

问题2:在打印输出中,方括号[]中的序列是质心。这是子组的最大中央序列。

问题3:请参阅回答质疑1

希望这有助于。

+0

非常感谢!第一季度/第三季度的快速后续行动:是否有基准,阈值或经验法则可以用来说明,例如,是否存在足够的差异,是否足够高等等。或者这只是一个指标(0 =非常低,1 =非常高)?谢谢! – user2720641

+0

作出编辑,回答你关于差异解释的问题 –

+0

感谢您的澄清。这导致了一个后续问题:我们显然有三种情况。 (A)具有显着Levene测试的树,(B)具有非显着Levene测试的树,如在上面的第一个图中,和(C)Levene(和其他测试)不显着的情况,但根本没有创建树(就像上面的第二个图)。现在,情况(B)和情况(C)之间究竟有什么区别?为什么TraMineR在情况(B)下创建树,而在情况下(C)不创建树? – user2720641