文末領取【SQL數據分析常用語句】
在進行數據分析時,經常會用到一些分析指標和術語,這些指標和術語可以幫助我們打開思路,從多種角度對數據進行深度解讀。
平均數(average)
一般指算術平均數。就是一組數據的算術平均值,即全部數據累加除以數據個數的結果。
例如:上一年公司一到四季度的銷售額分別為260萬、320萬、220萬、400萬,那麼平均季度銷售額為(260 + 320 + 220 + 400)/ 4 = 300,即平均季度銷售額為300萬。
絕對數(absolute number)與相對數(relative number)
絕對數:是總量指標,它是反映客觀現象總體在一定時間、地點條件下的總規模、總水平的綜合指標。例如:公司年銷售額2000萬,公司總人數160 人等。
絕對數也可以表現為某現象總體在一定時間、地點條件下數量增減變化的絕對數,例如:A產品的年銷售額比B產品的年銷售額多260萬。
相對數:是指兩個有聯繫的指標對比計算而得出的數值,它是反應客觀現象之間的數量聯繫緊密程度的綜合指標。相對數的計算公式:相對數 = 比較值(筆數)/基礎值(基數)
相對數一般以倍數、成數、百分數等表示,它反應客觀現象之間數量的聯繫程度。例如:公司女員工人數佔比20%;公司男女員工比例為1:5;本月銷售額是上個月的3倍;本季度銷售額只完成任務的8成等。
百分比(percentage)與百分點(percentage point)
百分比:相對數中的一種,他表示一個數是另一個數的百分之幾,也稱為百分率或百分數。
運用百分數時,也要注意概念的精確。例如:“比過去增長20%”,即過去為100,現在是“120”;“比過去降低20%”,即過去是100,現在是“80”;“降低到原來的20%”,即原來是100,現在是“20”等。
百分點:指不同時期以百分數形式表示的相對指標(如:速度、指數、構成等)的變動幅度。
例如:公司所有產品銷售總額中,A產品的銷售佔比由去年的25%上升到今的35%,我們可以說:公司銷售總額中,A產品所佔的比重,今年比去年上漲了10個百分點(35-25=10);但不能說上漲了10%。
頻數(Frequency )和頻率(Relative frequency)
頻數:在一組數據中,某個數據出現的次數叫作頻數。
頻率:某個數據出現的次數與總次數的比值稱為頻率。
例如:拋一枚硬幣100次,正面朝上有53次,反面朝上有47次,這裡硬幣正面朝上的頻率是53/100,正面朝上的頻數就是53,反面朝上的頻率是47/100,反面朝上的頻數是47。
比例(proportion)和比率(ratio)
比例:表示總體中的某一部分數量佔總體數量的比重, 反映總體的構成或者結構。一般用百分比的形式表示。
比率:表示總體中兩個部分之間的比較,反應總體中各部分的關係,用幾比幾的形式表示。
例如:公司有50人,男生30人,女生20人,男生比例是30:50, 女生的比例是20:50,男生與女生的比率是30:20
倍數(multiple)與番數(doubling)
倍數:表示一個數據是另一個數據的幾倍,通常用一個數據除以另一個數據獲得。例如:A/B=C,那麼A是B的C倍。
番數:指原來數量的2的n次方倍。例如:公司去年利潤為200萬,今年利潤比去年翻一番,即400萬(200 * 2);今年利潤比去年翻兩番,即800萬(200 * 2 * 2)。
同比(year-on-year)與環比(month-on-month)
同比:與歷史同時期進行比較得到的數值。
例如:我公司今年一季度A產品銷售額同比增加35%,意思是今年一季度A產品銷售額比去年一季度A產品銷售額增加35%,這是同比。
環比:與前一個統計期進行比較得到的數值。可以是2月與1月相比、8日與7日相比、二季度與一季度相比等等。
例如:我公司今年二季度B產品銷售額環比增加30%,意思是今年二季度B產品銷售額比一季度增加30%。
字段與記錄
字段:是代表事物或現象某種特徵的變量。例如:下表中的"員工薪酬“、"車輛費"等。
記錄:是事物特徵的具體表現。例如:下表中的一行即為一條記錄。
費用表
眾數
數據集合中出現次數最多的數值稱為眾數。如果有兩個或多個數值出現次數並列最多,那麼這兩個或多個數值都是該集合的眾數。
例如:數據集合{2、3、8、6、3、5、3、2、6、3}中眾數為3。
中位數
將數據集合中所有數據按照升序或降序排列,居於最中間的數值即為該集合的中位數,若集合中數值個數為奇數,取最中間一個為中位數,若集合中數值個數為偶數,取最中間兩個數值的算術平均數為中位數。
例如:{2、5、6、9、13、15、20}中位數為9;{3、5、6、8、9、12、13、17}中位數為(8+9)/2=8.5。
加權算術平均數
加權算術平均數是計算具有不同權重的數據的算術平均數。
所謂數據的權重是反映一個數據在數據集合中的重要性,一般用權數來表示。
將數據集合中各數據乘以相應的權數,然後加總求和再除以所有權數之和,即為該數據集合的加權算術平均數。它適用於已分組數據集合。
假設有一組數據集合,包含k個數據組,各組的簡單算術平均數分別為 、 、 、···、 ,每組數據的數據個數分別為 、 、 、···、 ,每組數據的個數就是該組數據的權數,那麼加權算術平均數的公式為:
例如:某水果超市購入蘋果200斤,每斤3.5元;香蕉180斤,每斤3.3元;葡萄260斤,每斤4.2元,那麼所購入的水果平均每斤多少元,通過加權算術平均數公式可得:
幾何平均數
在分析產品合格率、銀行利率、平均發展速度等問題時,數據之間的關係不是加減關係,而是乘除關係,應運用幾何平均數分析。
將數據集合中的n個數據連乘積的n次方根稱為幾何平均數。
假設一個數據集合的數據分別為 、 、 、···、 ,且所有數值都大於0,那麼該數據集合的幾何平均數公式為:
例如:某工廠有一條生產線有三道工序,每道工序的產品合格率分別為93%、88%、94%,計算這條生產線的平均合格率。
由於只有合格品才能進入下一道生產工序,所以每道工序的合格率之間是乘積關係,利用幾何平均數公式分析可得:
End.
來源:知乎
本文為轉載分享,如有侵權請聯繫後臺刪除
長按下方海報領取 【SQL數據分析常用語句】
< 零基礎入職數據分析就業班 >
課程形式主為“直播+錄播”
課程專享:
月考測試通關+課程項目作業+1v1職場生涯規劃+班主任輔導學習+資深講師答疑課程結束後能熟練掌握SQL、Python、Excel、PPT等數據分析工具
抓住4月復工熱潮,愛數據助你拿理想offer!