我有一个数据框df,我使用其中的几列来groupby:
df
groupby
df['col1','col2','col3','col4'].groupby(['col1','col2']).mean()
通过上述方式,我几乎得到了我需要的表格(数据框)。缺少的是包含每个组中的行数的附加列。换句话说,我的意思是,但我也想知道有多少数字被用来获得这些手段。例如,第一组有 8 个值,第二组有 10 个,依此类推。
简而言之:如何获得数据框的 分组 统计信息?
在groupby对象上,该agg函数可以采用一个列表来一次应用多个聚合方法。这应该会给你你需要的结果:
agg
df[['col1', 'col2', 'col3', 'col4']].groupby(['col1', 'col2']).agg(['mean', 'count'])