我一直在使用木槌推断包含100,000行(大约34 MB木槌格式)的文本文件的主题。但是现在我需要在包含一百万行(大约180MB)的文件上运行它,并且得到一个java.lang.outofmemory异常。有没有办法将文件分割成更小的文件,并为所有文件中的数据组合起来构建模型? 由于事先木槌主题建模
Q
木槌主题建模
6
A
回答
1
我不知道马利特的可扩展性,大数据,但项目http://dragon.ischool.drexel.edu/可以存储在磁盘备份持续它的数据,因此可以扩展到无限的语料规模(当然是低性能)
1
即使从多个文件中读取模型,该模型仍然会非常庞大。你有没有尝试增加你的Java虚拟机的堆大小?
0
鉴于当前PC的内存大小,应该很容易使用大到2GB的堆。 在考虑使用群集之前,您应该尝试单机解决方案。
1
java.lang.outofmemory异常发生的主要原因是堆空间不足。 您可以使用-Xms和-Xmx来设置堆空间,以便它不会再次出现。
6
在斌此行/ mallet.bat增加值:
set MALLET_MEMORY=1G
相关问题
- 1. 木槌主题建模 - 主题键输出参数
- 2. 使用槌子建模的主题
- 3. 木槌下载问题
- 4. 如何使用木槌提取主题关键短语
- 5. hLDA的木槌推理器
- 6. typeTopicCounts功能的主题建模实施槌子API
- 7. 木槌构图文件中的null-sources
- 8. 如何在木槌中使用--use-ngrams
- 9. 示例使用木槌(机器学习语言工程)
- 10. R中的主题建模
- 11. 在槌
- 12. 创建自定义模式为我的数据集在槌
- 13. 主题建模:LDA,词频每个主题和Wordcloud
- 14. 未能创建从Sunburst主题模板化的Plone主题
- 15. 获取槌球中所有文档的实例和主题序列
- 16. 使用gensim进行主题建模
- 17. [R主题建模避免create_matrix
- 18. 如何应用主题建模?
- 19. Rails建模问题 - 关系和主键
- 20. Drupal模板/主题资源或建议?
- 21. 用于Python中主题建模的LDA
- 22. 使用Word2Vec进行主题建模
- 23. 主题建模中的指令解释
- 24. MALLET vs NLTK中的主题建模
- 25. 主题/建立自己的模块
- 26. 在pubsub模拟器上创建主题
- 27. jcall中的R木槌错误:java.lang.NoSuchMethodException:给定参数没有合适的方法
- 28. 将背景图像添加到木星4 WordPress主题标题
- 29. 创建主题
- 30. 为Windows主题创建UI主题
它看起来像龙Toolkit是死的,但。自2007年以来没有任何活动。此外,尚不清楚它使用的是什么许可证(商业发展是否允许?) – chaostheory 2011-05-18 14:00:38