3

我正在运行使用Google云平台和Tensorflow和Keras的机器学习项目。我的数据集中有大约30,000个PNG图像。当我在本地运行它时,Keras有很多实用程序可以加载图像,但Google云服务需要使用某些库,例如tensorflow.file_io(请参阅:Load numpy array in google-cloud-ml job)才能从GC存储桶读入文件。为Google云端机器学习项目存储图像的最佳方法?

从Google云端存储分区加载图片的最佳方式是什么?现在我将它们保存为字节并从一个文件中读取它们,但能够直接从GC存储桶中加载图像会很棒。

谢谢,

回答

0

此信息可能对您有所帮助。

Tensorflow multithreading image loading

它使用新tf.data.Dataset API直接加载图像作为是,在一个高性能的方式。因此,您可以存储单个文件而不是单个文件......尽管如果使用类似于每个记录包含图像的TFRecord文件,单个文件可能会提供更好的性能。

希望有帮助!