我想了解LDA主题模型如何在槌子API中实现。在ParallelTopicModel
类中,我可以看到一个称为typeTopicCounts
的2D int数组,它在buildInitialTypeTopicCounts()
方法中通过一些按位操作初始化,并稍后用于每个文档。我的问题是这个数组值意味着什么?我只能从源代码中获得的信息是它被[特征索引,主题索引]索引。typeTopicCounts功能的主题建模实施槌子API
0
A
回答
0
针对LDA的吉布斯采样的计算性能主要是通过计算每个词标记的主题抽样分布。话题模型被设置为在话语和话题之间具有很多稀疏的关系。如果我们可以通过从一个词到下一个词节省尽可能多的计算并且只做有意义的计算(比如不乘以零)来使得计算更有效率,那么我们可以获得很大的加速。
每个单词类型在typeTopicCounts
数组中有一个int
s的数组。这个数组中的每个int
值的含义使用位移运算符编码两个一个话题和一个令牌计数。计数值位于高位,因此我们可以按“计数”对主题进行排序,而无需“解包”整数。从这个方法的教程
幻灯片都可以在这里:
https://mimno.infosci.cornell.edu/slides/fast-sparse-sampling.pdf
相关问题
- 1. 使用槌子建模的主题
- 2. 木槌主题建模
- 3. 木槌主题建模 - 主题键输出参数
- 4. 如何实施和使用的子模式从System.Console.CmdArgs功能
- 5. C:实施rownames的功能
- 6. 实施非会员功能
- 7. 实施“IntBitsToFloat”功能在VB.NET
- 8. R主题建模:lda模型标注功能
- 9. 问题实施模型
- 10. Facebook的采访:实施readline的功能
- 11. 禁用wordpress子主题功能
- 12. 如何实施YouTube的评论功能?
- 13. 实施Excel的小计功能
- 14. 搜索功能的Django项目实施
- 15. 实施Rails的API
- 16. 实施主题4个应用
- 17. 在计划中实施“收集”功能
- 18. 实施版本控制功能
- 19. 难度实施NSUndoManager重做功能
- 20. 问题而实施军刀车API
- 21. 未能创建从Sunburst主题模板化的Plone主题
- 22. 实施公共API
- 23. 获取槌球中所有文档的实例和主题序列
- 24. iPhone上的Salesforce Api实施
- 25. Drupal主题功能不叫?
- 26. 问题实施拦截模式
- 27. R中的主题建模
- 28. 木槌下载问题
- 29. UIMapkit实施问题
- 30. Backprop实施问题