给定一个大小为numpy的数组n和一个整数,m我想生成m该数组的所有顺序长度子序列,最好是二维数组。
n
m
例:
>>> subsequences(arange(10), 4) array([[0, 1, 2, 3, 4, 5, 6], [1, 2, 3, 4, 5, 6, 7], [2, 3, 4, 5, 6, 7, 8], [3, 4, 5, 6, 7, 8, 9]])
我能想到的最好方法是
def subsequences(arr, m): n = arr.size # Create array of indices, essentially solution for "arange" input indices = cumsum(vstack((arange(n - m + 1), ones((m-1, n - m + 1), int))), 0) return arr[indices]
我是否缺少更好的(最好是内置的)功能?
这是一种非常快速且内存有效的方法,仅是对原始数组的“查看”:
from numpy.lib.stride_tricks import as_strided def subsequences(arr, m): n = arr.size - m + 1 s = arr.itemsize return as_strided(arr, shape=(m,n), strides=(s,s))
np.copy如果需要写入此数组,则应先做一个步骤,否则,您将修改原始数组和“子序列”数组中的相应条目。
np.copy