2017-08-02 86 views
0

我是新来的主题建模和种类的困惑。我已经多次用不同的主题数量值运行MALLET。那么我怎么知道选择哪一个进行进一步分析呢?我知道有些论文涉及主题模型的评估,但我不能编写这样的代码。选择一个主题模型

+0

如果你不能编码这样的东西,你问这个问题,编码问题和答案平台,我很困惑你在问什么。 – Rob

回答

1

不要将主题的数量视为文档的自然特征。它们并不是多项分布的组合,所以没有“正确的”答案。有很多很好的价值。

您应该将主题的数量视为集合的地图比例。如果您想要广泛的概述,请使用较少的主题。如果你想要更多的细节,请使用更多。正确的数字是产生有意义的结果的值,可以让您完成目标。