2017-03-08 349 views
1

我一直在尝试使用不同的方法来确定LDA中的主题频率(在R中),并且偶然发现了非常有用的包ldatuning,但无法真正弄清楚控制参数,特别是种子的示例值。'种子'在'ldatuning'中确定LDA主题频率(R)的含义是什么?

下面是从网站的示例代码:

library("topicmodels") 
data("AssociatedPress", package="topicmodels") 
dtm <- AssociatedPress[1:10, ] 

result <- FindTopicsNumber(
    dtm, 
    topics = seq(from = 2, to = 15, by = 1), 
    metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"), 
    method = "Gibbs", 
    control = list(seed = 77), 
    mc.cores = 2L, 
    verbose = TRUE 
) 

我与参数有点发挥各地,并注意到,在种子的价值的变化而改变输出曲线相当显著。有人能解释一下这个例子中的77是什么意思,以及如何选择种子的价值?

另外,我无法找到任何其他选项来输入控件的内容以及对结果有什么影响。如果任何人都可以在这里提供一些很好的指导。

回答

0

种子: “整数”类的对象;用于设置外部代码中的种子以进行VEM估计,并调用set.seed进行Gibbs采样。对于Gibbs采样,它也可以设置为NA(默认),以避免在模型拟合调用中更改随机数生成器的种子。

相关问题