潜类分析模型选择

进行潜类分析时，有时候信息标准（即AIC，BIC，aBIC）不会选择相同的模型。在我对774名男男性行为者进行的物质使用模式研究中就是这种情况。图1显示了每个潜在类别数量的拟合标准。 BIC和CAIC选择三类模型（见图2）。但是，aBIC选择五类模型（见图2）。潜类分析模型选择

如何在这些情况下选择模型解决方案？有没有办法选择变量或折叠变量以优化结果？

来源

2017-06-21 Kiffer Card

这是不容易的，选择的类LCA的数量，但也有一些经验法则，我遵循：基于Nylund, Asparouhov & Muthén (2007)

要遵循BIC和自举似然比检验（BLRT）。即使那样，他们也很少同意--BLRT会告诉你选择一个更多班级的模型，BIC将会更保守，并且会提出更少的班级。但是，通过使用统计测试，这与您所能得到的一样接近。
依靠您模型的可用理论。寻找与你的理论知识潜在的差异，并试图从理论中推断出预计有多少类别。没有黄金法则，LCA是一个好方法，但没有理论就没有意义。如果你没有什么理论，你可以做什么来仔细检查你的发现是将你的潜在变量与远端结果（协变量）联系起来，你可能会有一些理论，看看它是否有效。例如，您怀疑您的某个潜在类将被一种性别所控制：将您的潜在变量与性别关联并查看。简约法则：简单模型比复杂模型更受欢迎（Collins & Lanza，2010）。如果一个简单的模型完成所有的工作，为什么选择一个复杂的模型？

就你而言，我将从3类模型开始，因为它是由BIC和简约建议的。完成分析和解释结果后，我会重新运行4/5班的模型，看看是否会达到实质上不同的结果 - 值得报道的东西，任何重要或矛盾的发现，我发现与3班模特。如果它只是增加了复杂性，但并不矛盾或改善我已经知道的，我会坚持3类模型。

看看结果，我认为5类模型没有提供超出3个类的任何东西。在三类模型中，你有一类广泛吸毒者（16％），以大麻，罂粟，致幻剂和可卡因为主的中度吸毒者（40％），最后是一类以酒精和大麻为主的轻度使用者（44 ％）。 5级模型将前两组分为特定的较小子组，但您必须决定这些分组是否对您的研究很重要 - 无论这些分组对您的研究问题是否有意义。

我还建议检查双变量残差。建议更多类别的模型错配可能是由您的指标之间的残余关联产生的。如果你可以在理论上证明它的正确性（例如，通过发现潜在类别之外的指标之间的某种相似性），则可以添加残差关联并获得与3类别模型类似的良好拟合。

最后一点，完全避免使用AIC进行LCA - 这是一个性能很差的索引！改用cAIC，BIC和aBIC。 AIC不会校正样本量，对于较大的样本来说这可能会有问题。

源头：

柯林斯，L.M。，&兰扎，S.T。（2010）。潜类和潜在转变分析：适用于社会，行为和健康科学。纽约：威利。

来源

2017-06-30 15:29:36 MartinBL

潜类分析模型选择

回答

相关问题