数据透视表是一个非常实用的功能,可以pandas的pivot_table()来实现。
pd.pivot_table(df, index='客户分类', columns='区域',values=['用户ID','7月销量'], aggfunc={'用户ID':'count','7月销量':'sum'},margins=True, margins_name='合计',fill_value=0).reset_index()
# df是原始表
# index是新表的index
# columns是新表的列(会按照区域的实际值进行分组)
# values是新表要统计数值,这里有两个
# aggfunc给每个要统计数值以方法,可是count计数,也可以是求和
# margins增加合计行和列,默认不开启
# margins_name修改合计行和列的名称,默认为all
# fill_value将缺失值填为0
# reset_index()重置索引