我读的书Python和HDF5(O'Reilly)的其中有他们承担磁盘上的空数据集A部分和尺寸:尺寸上的部分填充HDF5数据集的磁盘
import numpy as np
import h5py
f = h5py.File("testfile.hdf5")
dset = f.create_dataset("big dataset", (1024**3,), dtype=np.float32)
f.flush()
# Size on disk is 1KB
dset[0:1024] = np.arange(1024)
f.flush()
# Size on disk is 4GB
在用数据填充数据集的部分(前1024个条目)之后,我预计文件会增长,但不会达到4GB。它基本上与我的尺寸相同:
dset[...] = np.arange(1024**3)
该书指出,磁盘上的文件大小应该在66KB左右。任何人都可以解释突然增大的原因是什么?
版本信息:
- 的Python 3.6.1(OSX)
- h5py 2.7.0