我有两个数组,比如说varx和variant。两者在不同位置都包含NAN值。但是,我想对两者进行线性回归,以显示两个数组之间的相关程度。到目前为止,这非常有帮助:http : //glowingpython.blogspot.de/2012/03/linear- regression-with-numpy.html
但是,使用此:
slope, intercept, r_value, p_value, std_err = stats.linregress(varx, vary)
对每个输出变量都得出nans。从两个数组中仅取有效值作为线性回归的输入的最便捷方法是什么?我听说过遮罩数组,但是不确定其工作原理。
您可以使用遮罩删除NaN:
mask = ~np.isnan(varx) & ~np.isnan(vary) slope, intercept, r_value, p_value, std_err = stats.linregress(varx[mask], vary[mask])