如果我使用这样的1或NaNpandas.core.series.Series命名ts:
pandas.core.series.Series
ts
3382 NaN 3381 NaN ... 3369 NaN 3368 NaN ... 15 1 10 NaN 11 1 12 1 13 1 9 NaN 8 NaN 7 NaN 6 NaN 3 NaN 4 1 5 1 2 NaN 1 NaN 0 NaN
我想计算该系列的总和,但应在NaN的位置将其重置(设置为零),如下所示:
3382 0 3381 0 ... 3369 0 3368 0 ... 15 1 10 0 11 1 12 2 13 3 9 0 8 0 7 0 6 0 3 0 4 1 5 2 2 0 1 0 0 0
理想情况下,我希望有一个矢量化解决方案!
我曾经在Matlab上看到过类似的问题: 在NaN上重置Matlabcumsum吗?
但我不知道如何翻译这行 d = diff([0 c(n)]);
d = diff([0 c(n)]);
Matlab代码的简单Numpy翻译是这样的:
import numpy as np v = np.array([1., 1., 1., np.nan, 1., 1., 1., 1., np.nan, 1.]) n = np.isnan(v) a = ~n c = np.cumsum(a) d = np.diff(np.concatenate(([0.], c[n]))) v[n] = -d np.cumsum(v)
执行此代码将返回结果array([ 1., 2., 3., 0., 1., 2., 3., 4., 0., 1.])。此解决方案仅会与原始解决方案一样有效,但是如果它不足以满足您的目的,它可能会帮助您提供更好的解决方案。
array([ 1., 2., 3., 0., 1., 2., 3., 4., 0., 1.])