19. Pandas的DataFrame的统计函数

DataFrame和Series都是pandas下的核心数据,series有统计函数,DataFrame也可以用统计里的各个函数,各个函数的意义和使用可以参考Series统计函数一章,本章就不再累述相应内容了。

import pandas as pd
import numpy as np
val = np.random.randn(5, 4)
idx = list("abcd")
df = pd.DataFrame(val, columns = idx)
print df
print df.describe()

程序执行结果:

          a         b         c         d
0 -0.385711 -1.294148  0.587965  0.679378
1  1.608339 -0.264607 -0.633850 -0.330153
2  0.536612  0.235176 -0.144298  1.436553
3  0.667061 -0.170487  0.411623 -1.887972
4  0.952012  0.083225 -0.235072 -0.978071
              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.675663 -0.282168 -0.002726 -0.216053
std    0.723218  0.599592  0.498233  1.315476
min   -0.385711 -1.294148 -0.633850 -1.887972
25%    0.536612 -0.264607 -0.235072 -0.978071
50%    0.667061 -0.170487 -0.144298 -0.330153
75%    0.952012  0.083225  0.411623  0.679378
max    1.608339  0.235176  0.587965  1.436553