Pandas入門之統計與彙總一

統計函數describe

可以得到數據的統計信息

<code> df.describe()
#得到的統計信息包括
# count – 數量
# mean – 平均值
# std – 標準差
# min – 最小值
# 25% –下四分位數
# 50% – 二分位數
# 75% –上四分位數
# max – 最大值/<code>

求和

在DataFrame中,可以通過sum()對每列求和彙總


<code>df = DataFrame(np.random.randn(3,3),columns=[‘a’, ‘b’, ‘c’])
df.sum() #默認垂直方向求和,即每列求和
df.sum(axis=1) #水平軸向求和,/<code>
  • axis=0表示垂直軸向,axis=1表示水平軸向,不寫默認垂直軸向

唯一值與值統計

<code>obj = Series([1,2,1,2,3,4,5,3])
obj.unique() #計算唯一值
obj.value_counts() #獲取值計數

# dataframe對象的唯一值與值統計
df = DataFrame([[1,2,1],[1,2,2]], columns=[‘a’, ‘b’, ‘c’])
df1 = df[‘a’].unique()
df1 = df[‘a’].value_counts()
df1 = df.loc[0].unique()
df1 = df.loc[0].value_counts()
/<code>


分享到:


相關文章: