2016-11-10 1160 views
1

我用sklearn和gensim应用了lda。然后我检查了数据的困惑。SKlearn LDA与Gensim LDA的困惑对比问题

我对gensim的困惑和对于sklearn perpleixy的正面价值有越来越多的价值。我如何比较这些值。

sklearn困惑= 417185.466838

gensim困惑= -9212485.38144

+0

你是如何获得这两个困惑? – MMF

+0

@MMF在sklearn中: - lda.perplexity(doc_test)和gensim: - ldamodel.bound(doc_test) – MachoMan

回答

0

为了比较,你需要使用np.exp(-1. * gensim_model.log_perplexity(train_corpus))转换gensim的困惑困惑。

有关Gensim和Sklearn LDA实现的一般比较,请参见here