1
我一直在尝试使用不同的方法来确定LDA中的主题频率(在R中),并且偶然发现了非常有用的包ldatuning,但无法真正弄清楚控制参数,特别是种子的示例值。'种子'在'ldatuning'中确定LDA主题频率(R)的含义是什么?
下面是从网站的示例代码:
library("topicmodels")
data("AssociatedPress", package="topicmodels")
dtm <- AssociatedPress[1:10, ]
result <- FindTopicsNumber(
dtm,
topics = seq(from = 2, to = 15, by = 1),
metrics = c("Griffiths2004", "CaoJuan2009", "Arun2010", "Deveaud2014"),
method = "Gibbs",
control = list(seed = 77),
mc.cores = 2L,
verbose = TRUE
)
我与参数有点发挥各地,并注意到,在种子的价值的变化而改变输出曲线相当显著。有人能解释一下这个例子中的77是什么意思,以及如何选择种子的价值?
另外,我无法找到任何其他选项来输入控件的内容以及对结果有什么影响。如果任何人都可以在这里提供一些很好的指导。