在Python Pandas中,检查DataFrame是否具有一个(或多个)NaN值的最佳方法是什么?
我知道函数pd.isnan,但是这会为每个元素返回一个布尔值的DataFrame。此处的帖子也无法完全回答我的问题。
pd.isnan
jwilner的反应是现场的。我一直在探索是否有更快的选择,因为根据我的经验,求平面数组的总和(奇怪)比计数快。这段代码似乎更快:
df.isnull().values.any()
import numpy as np import pandas as pd import perfplot def setup(n): df = pd.DataFrame(np.random.randn(n)) df[df > 0.9] = np.nan return df def isnull_any(df): return df.isnull().any() def isnull_values_sum(df): return df.isnull().values.sum() > 0 def isnull_sum(df): return df.isnull().sum() > 0 def isnull_values_any(df): return df.isnull().values.any() perfplot.save( "out.png", setup=setup, kernels=[isnull_any, isnull_values_sum, isnull_sum, isnull_values_any], n_range=[2 ** k for k in range(25)], )
df.isnull().sum().sum()速度稍慢,但当然还有其他信息-的数量NaNs。
df.isnull().sum().sum()
NaNs