我的主要目标是从一个巨大的浮点矩阵计算中值(按列)。例如:Python - 从文件中获取列迭代器(不需要读取整个文件)
a = numpy.array(([1,1,3,2,7],[4,5,8,2,3],[1,6,9,3,2]))
numpy.median(a, axis=0)
Out[38]: array([ 1., 5., 8., 2., 3.])
矩阵是太大,不适合在Python内存(约5兆兆字节),所以我把它在一个CSV文件。 所以我想跑过每一列并计算中位数。
我有没有办法让列迭代器不读取整个文件?
关于计算矩阵中位数的任何其他想法也是好的。谢谢!
另请参阅:http://stackoverflow.com/questions/1053928/python-numpy-very-large-matrices –