2017-06-21 146 views
0

进行潜类分析时,有时候信息标准(即AIC,BIC,aBIC)不会选择相同的模型。在我对774名男男性行为者进行的物质使用模式研究中就是这种情况。图1显示了每个潜在类别数量的拟合标准。 BIC和CAIC选择三类模型(见图2)。但是,aBIC选择五类模型(见图2)。潜类分析模型选择

如何在这些情况下选择模型解决方案?有没有办法选择变量或折叠变量以优化结果?

回答

0

这是不容易的,选择的类LCA的数量,但也有一些经验法则,我遵循:基于Nylund, Asparouhov & Muthén (2007)

  1. 要遵循BIC和自举似然比检验(BLRT) 。即使那样,他们也很少同意--BLRT会告诉你选择一个更多班级的模型,BIC将会更保守,并且会提出更少的班级。但是,通过使用统计测试,这与您所能得到的一样接近。
  2. 依靠您模型的可用理论。寻找与你的理论知识潜在的差异,并试图从理论中推断出预计有多少类别。没有黄金法则,LCA是一个好方法,但没有理论就没有意义。如果你没有什么理论,你可以做什么来仔细检查你的发现是将你的潜在变量与远端结果(协变量)联系起来,你可能会有一些理论,看看它是否有效。例如,您怀疑您的某个潜在类将被一种性别所控制:将您的潜在变量与性别关联并查看。简约法则:简单模型比复杂模型更受欢迎(Collins & Lanza,2010)。如果一个简单的模型完成所有的工作,为什么选择一个复杂的模型?

就你而言,我将从3类模型开始,因为它是由BIC和简约建议的。完成分析和解释结果后,我会重新运行4/5班的模型,看看是否会达到实质上不同的结果 - 值得报道的东西,任何重要或矛盾的发现,我发现与3班模特。如果它只是增加了复杂性,但并不矛盾或改善我已经知道的,我会坚持3类模型。

看看结果,我认为5类模型没有提供超出3个类的任何东西。在三类模型中,你有一类广泛吸毒者(16%),以大麻,罂粟,致幻剂和可卡因为主的中度吸毒者(40%),最后是一类以酒精和大麻为主的轻度使用者(44 %)。 5级模型将前两组分为特定的较小子组,但您必须决定这些分组是否对您的研究很重要 - 无论这些分组对您的研究问题是否有意义。

我还建议检查双变量残差。建议更多类别的模型错配可能是由您的指标之间的残余关联产生的。如果你可以在理论上证明它的正确性(例如,通过发现潜在类别之外的指标之间的某种相似性),则可以添加残差关联并获得与3类别模型类似的良好拟合。

最后一点,完全避免使用AIC进行LCA - 这是一个性能很差的索引!改用cAIC,BIC和aBIC。 AIC不会校正样本量,对于较大的样本来说这可能会有问题。

源头

柯林斯,L.M。,&兰扎,S.T。(2010)。潜类和潜在转变分析:适用于社会,行为和健康科学。纽约:威利。