统计描述
如果希望一次性输出多个统计指标,比如平均值、最大值、最小值、求和等,则我们可以调用describe()方法实现,而不用再单独地逐个调用相应的统计方法。describe()方法的语法格式如下:
describe(percentiles=None, include=None, exclude=None)
上述方法中常用参数的含义如下:
(1)percentiles:输出中包含的百分数,位于[0,1]之间。如果不设置该参数,则默认为[0.25,0.5,0.75],返回25%,50%,75%分位数。
(2)include,exclude:指定返回结果的形式。
例如,创建一个DataFrame对象来描述它的多个统计指标,具体代码如下。
In [63]: df_obj = pd.DataFrame([[12, 6, -11, 19],
[-1, 7, 50, 36],
[5, 9, 23, 28]])
df_obj
Out[63]:
0 1 2 3
0 12 6 -11 19
1 -1 7 50 36
2 5 9 23 28
In [64]: df_obj.describe() # 输出多个统计指标
Out[64]:
0 1 2 3
count 3.000000 3.000000 3.000000 3.000000
mean 5.333333 7.333333 20.666667 27.666667
std 6.506407 1.527525 30.566867 8.504901
min -1.000000 6.000000 -11.000000 19.000000
25% 2.000000 6.500000 6.000000 23.500000
50% 5.000000 7.000000 23.000000 28.000000
75% 8.500000 8.000000 36.500000 32.000000
max 12.000000 9.000000 50.000000 36.000000