我有一个大约1GB的数据集,它不适合内存(因为当我们在R中应用LM时,它也会创建其他消耗内存的变量)。我想知道在这种情况下是否还有一种方法可以在R中使用这些漂亮的机器学习软件包(例如,glm,随机森林,神经网络)来进行分析?我赞赏任何建议和参考。将R中的机器学习包应用于大型数据集
0
A
回答
2
请参阅high-performance task view on CRAN,特别是有关大内存和内存不足数据的部分。
或者:您可能需要付钱,但可以考虑使用Microsoft R Server。 MRS,以前称为Revolution R Enterprise,旨在打破处理大型数据集时的内存障碍。它适用于Windows和Linux,还允许使用SQL Server,Teradata,Hadoop(Cloudera,Hortonworks和HDInsight)和Spark进行数据库内分析。
披露:我是微软员工。
1
相关问题
- 1. 用于处理机器学习的大型数据集的设计模式
- 2. 大型机器学习
- 3. python中的机器学习外部数据集学习
- 4. 医疗机器学习数据集
- 5. R机器学习包来处理大量的因素
- 6. 机器学习 - 与大数据集的问题
- 7. Web数据上的大型机器学习
- 8. 机器学习 - 巨大只有正面文本数据集
- 9. 关于金融大数据的机器学习
- 10. 机器学习形状和类型的机器学习
- 11. 机器学习训练数据集的大小应该是多少?
- 12. 如何在机器学习模型中使用R脚本将列名添加到输入数据集
- 13. 无法将PlainText(JSON)连接到Azure机器学习数据集
- 14. 机器学习的挑战:在Java/Groovy中(数据挖掘,机器学习)
- 15. 如何将机器学习与Web应用程序集成?
- 16. 机器学习中的标称值数据集
- 17. 寻找在机器学习中包含字符串值的数据集
- 18. 如何分辨机器学习模型的学习型
- 19. 用于学习字符串模式的机器学习技术
- 20. 用于机器学习的Python导入
- 21. 用于机器学习的外部GPU
- 22. 适用于Android的机器学习库
- 23. 将机器学习应用于分析混合语言
- 24. 如何将机器学习应用于模糊匹配
- 25. 使用R和randomForestSRC包进行机器学习
- 26. 关于机器学习中相同数据集的不同结果
- 27. 使用翻转图像进行机器学习数据集
- 28. 用于机器学习的数据转换
- 29. 用于数据分类的机器学习算法。
- 30. 具有许多离散功能的机器学习数据集
检查[HPC任务视图](https://cran.r-project.org/web/views/HighPerformanceComputing.html)的“大内存和内存不足数据”部分 –