学科分类
目录
数据分析

统计描述

如果希望一次性输出多个统计指标,比如平均值、最大值、最小值、求和等,则我们可以调用describe()方法实现,而不用再单独地逐个调用相应的统计方法。describe()方法的语法格式如下:

describe(percentiles=None, include=None, exclude=None)

上述方法中常用参数的含义如下:

(1)percentiles:输出中包含的百分数,位于[0,1]之间。如果不设置该参数,则默认为[0.25,0.5,0.75],返回25%,50%,75%分位数。

(2)include,exclude:指定返回结果的形式。

例如,创建一个DataFrame对象来描述它的多个统计指标,具体代码如下。

In [63]: df_obj = pd.DataFrame([[12, 6, -11, 19], 
                                [-1, 7, 50, 36],
                                [5, 9, 23, 28]])
        df_obj

Out[63]:
  0 1   2  3
0 12 6 -11 19
1 -1 7 50 36
2  5 9 23 28
In [64]: df_obj.describe()  # 输出多个统计指标
Out[64]: 
​         0      1      2      3
count  3.000000 3.000000  3.000000  3.000000
mean  5.333333 7.333333 20.666667 27.666667
std   6.506407 1.527525 30.566867  8.504901
min  -1.000000 6.000000 -11.000000 19.000000
25%   2.000000 6.500000  6.000000 23.500000
50%   5.000000 7.000000 23.000000 28.000000
75%   8.500000 8.000000 36.500000 32.000000
max  12.000000 9.000000 50.000000 36.000000
点击此处
隐藏目录