tl; dr是否 可以在不使用numpy.reshape的情况下将numpy数组的视图从5x5x5x3x3x3重塑为125x1x1x3x3x3?
我想对一个体积(大小为MxMxM)执行一个滑动窗口操作(具有不同的步幅)。如本杰明(Benjamin)和艾肯伯格(Eickenberg)numpy.lib.stride_tricks.as_strided先前建议的那样,可以使用生成滑动窗口数组,并在下面的代码片段中进行了演示,该代码片段使用了skimage中的helper方法,该方法使用。as_strided
numpy.lib.stride_tricks.as_strided
as_strided
此辅助方法的输出为我提供了NxNxNxnxnxn的形状,但我希望该形状为N ^ 3x1xnxnxn。虽然我可以使用np.reshape来实现此目的,但是如果体积变大(> 100x100x100),np.reshape就会变慢,我不确定为什么。我以为可以使用as_stride重塑输出,但是numpy崩溃了(下面的代码段)。关于如何在不使用np.reshape的情况下如何从helper方法获得输出的任何想法N ** 3x1xnxnxn?
import numpy as np import skimage l = 15 s = 3 X = np.ones((l,l,l)) print('actual shape',X.shape) view = skimage.util.shape.view_as_blocks(X,(s,s,s)) print('original view',view.shape) new_shape = ((l/s)**3,1,1,s,s,s) print('new view',new_shape) view_correct = view.reshape(new_shape) print(view_correct.shape) print('coord:','124,0,0,2,2,2','value:',view_correct[124,0,0,2,2,2]) view_incorrect = np.lib.stride_tricks.as_strided(view, shape=new_shape) print(view_incorrect.shape) print('coord:','124,0,0,2,2,2','value:',view_incorrect[124,0,0,2,2,2])
我从中举了一个例子view_as_blocks,并尝试了您的重塑风格:
view_as_blocks
A = np.arange(4*4).reshape(4,4) B = view_as_blocks(A, block_shape=(2, 2)) print(A.__array_interface__) print(B.__array_interface__) C = B.reshape((2*2,2,2)) print(C.__array_interface__)
生产:
{'typestr': '<i4', 'data': (153226600, False), 'shape': (4, 4), 'descr': [('', '<i4')], 'version': 3, 'strides': None} {'typestr': '<i4', 'data': (153226600, False), 'shape': (2, 2, 2, 2), 'descr': [('', '<i4')], 'version': 3, 'strides': (32, 8, 16, 4)} {'typestr': '<i4', 'data': (150895960, False), 'shape': (4, 2, 2), 'descr': [('', '<i4')], 'version': 3, 'strides': None}
在data用于指针A和B是相同的; B是对的看法A。
data
A
B
但是指向的指针C是不同的。它是副本。这就解释了为什么需要这么长时间。
C
让我们做一些不同的事情:
A = np.arange(4*4).reshape(4,4) B = view_as_blocks(A, block_shape=(2, 2)) print(A.__array_interface__) print(B.__array_interface__) C = B.reshape((2*2,1,2,2)) print(C.__array_interface__) D = as_strided(B, shape=(2*2,1,2,2)) print(D.__array_interface__) print(B[1,1,:,:]) print(C[3,0,:,:]) print(D[3,0,:,:])
生产
1254:~/mypy$ python3 skshape.py {'strides': None, 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (4, 4), 'descr': [('', '<i4')]} {'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (2, 2, 2, 2), 'descr': [('', '<i4')]} {'strides': None, 'typestr': '<i4', 'version': 3, 'data': (155705400, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]} {'strides': (32, 8, 16, 4), 'typestr': '<i4', 'version': 3, 'data': (154278744, False), 'shape': (4, 1, 2, 2), 'descr': [('', '<i4')]} [[10 11] [14 15]] [[10 11] [14 15]] [[ 154561960 -1217783696] [ 48 3905]]
再次重塑会创建一个副本。第二个as_strides返回一个视图,但跨度被拧紧。它正在查看原始数据缓冲区之外的内存(这就是为什么自己大步走很危险的部分原因)。
as_strides
在我的示例中,查看每个块的第一个角值
print(B[:,:,0,0]) print(C[:,0,0,0]) [[ 0 2] [ 8 10]] [ 0 2 8 10]
对于B,行增加8,列增加2;这反映在(32,8)(4 * 8,4 * 2)步幅上。
(32,8)
但是C步骤是(2,6,2)-大步前进无法做到。
由此我得出结论,没有复制就不可能进行重塑。