2014-10-30 142 views
2

我有一个函数将一些数据加载到2D numpy数组中。我想让函数调用指定可以从开始和结束中删除的行数和列数。如果未指定参数,则返回所有数据。现在numpy数组结尾的索引

import numpy as np 
function load_data(min_row, max_row, min_col, max_col): 
    a = np.loadtxt('/path/to/mydata.txt')[min_row:max_row,min_col:max_col] 

min_rowmin_col可能默认为0。如何将max_colmax_row的默认值设置为指向数组的末尾?

我唯一的解决办法是:

function load_data(min_row=0, max_row=None, min_col=0, max_col=None): 
    a = np.loadtxt('/path/to/mydata.txt') 
    if not max_row: max_row = a.shape[0] 
    if not max_col: max_col = a.shape[1] 
    a = a[min_row:max_row,min_col:max_col] 

是否有更好的解决方案,是这样的:

function load_data(min_row=0, max_row="end", min_col=0, max_col="end"): 
    a = np.loadtxt('/path/to/mydata.txt')[min_row:max_row,min_col:max_col] 

根据记录,例如数据可能是:

np.array([[1, 2, 3, 4, 5], 
      [1, 2, 3, 4, 5], 
      [1, 2, 3, 4, 5], 
      [1, 2, 3, 4, 5], 
      [1, 2, 3, 4, 5]]) 

回答

3

你可以只需在切片中直接使用None,例如,

x = np.arange(10) 
x[2:None] # array([5, 6, 7, 8, 9]) 

,或者你可以写你的功能,如:

function load_data(min_row=0, max_row=None, min_col=0, max_col=None): 
    a = np.loadtxt('/path/to/mydata.txt') 
    a = a[min_row:max_row,min_col:max_col] 

在这里,你也可以与None代替你分钟默认了。这是可行的,因为None被用作slice object中的默认值。有关在numpy切片中使用None的更多明确文档,请参阅Basic Slicing docs description末尾的注释框。

+1

你也可以省略'None'到'x [2:]'和'a [min_row:,min_col:]' – eickenberg 2014-10-30 21:27:49