在用python编写的深度学习程序中,我想要一次性在numpy数组中存储大量图像数据,并从该数组中随机提取批量数据,但图像数据太大,内存耗尽。 我们应该如何处理这种情况?每次检索批处理数据时,我别无选择,只能进行IO处理并从存储中读取图像数据?我想读取大量的图像进行深度学习,但当内存不足时该如何解决?
1
A
回答
1
文件I/O可以解决这个问题,但会减慢Leanring进程,因为FILE I/O是一项需要很长时间的任务。
但是,您可以尝试使用多线程(例如,
https://github.com/stratospark/keras-multiprocess-image-data-generator
(我不知道你用的是什么样的架构)。
好歹回到基本思想:
挑选一些随机的文件以及阅读它们,开始训练。在训练期间开始第二个线程,它将再次读取随机文件。因此,您的学习线程无需等待新数据,因为培训过程可能比读取过程花费更长的时间。
一些框架有这个功能已经实现,退房:
https://github.com/fchollet/keras/issues/1627
或:
https://github.com/pytorch/examples/blob/master/mnist_hogwild/train.py
相关问题
- 1. 当读大文件时内存不足
- 2. 准备jpg图像数据进行深度学习?
- 3. 我想学习如何组成图像
- 4. 图像分类深度学习
- 5. 我该如何解决Magento内存不足致命错误?
- 6. 我的显卡适合用MATLAB进行深度学习吗?
- 7. 如何解决内存不足问题
- 8. 我该如何解决这个图像内存泄漏?
- 9. 为什么我们需要GPU进行深度学习?
- 10. 使用AMD图形卡在Matlab上进行深度学习
- 11. 在深度学习中使用AlexNet进行图像识别的奇怪结果
- 12. 从SD卡读取图像时出现内存不足错误
- 13. 如何应用UI学习自动化的深度学习?
- 14. 如何解决从drawable设置图像时出现内存不足错误?
- 15. 用于映射大型二进制输入的深度学习
- 16. 如何培养深度学习网络
- 17. 学习C#,想了解该代码
- 18. 在读取大文件时系统内存不足的问题
- 19. 如何解决大熊猫scikit学习多维尺度始终运行
- 20. 图像的深度学习必须具有相同的大小吗?
- 21. 准备输入到Caffe深度学习的图像数据集
- 22. 深度学习中的图像预处理
- 23. 加载大量的图像导致内存不足
- 24. 当我想从表中读取特定批量大小时,如何在sql中进行取整
- 25. 我想从头开始学习wordpress。我如何学习?
- 26. AssertionError当我使用深度学习库Keras
- 27. UrlEncodedFormEntity与图像时内存不足
- 28. SOLR内存不足错误读取索引大型索引时
- 29. 当在Android上用Apache poi读取xls时内存不足
- 30. 如何使用hyperopt进行Keras深度学习网络的超参数优化?
当内存即将用完时,操作系统会自动开始将数据移动到HDD。这是最糟糕的情况,尤其是您的硬盘缓慢,每个应用程序都会变慢。这也消耗CPU资源。所以至少你必须控制数据量不要达到最大内存大小。 –