你被平均了嗎?

去年騰訊二季度財報一公佈,網上就有文章“騰訊員工平均月薪7萬元”,看到這樣的文章,估計很多騰訊員工都苦笑,又被平均了。在統計分析中,解決這種“被平均”問題,讓平均數更加能反映真實平均水平,經常需要去掉資料中的最大值和最小值再求平均,例如,圖1的B列資料中,求近20個數據除去最大值和最小值求平均值。本文介紹2種方法。

公式1:=(SUM(B2:B21)-LARGE(B2:B21,1)-SMALL(B2:B21,1))/(COUNT(B2:B21)-2)

公式意思是用B2:B21的總和減去最大值和最小值,再除以參與計算平均值的資料個數。

LARGE(B2:B21,1) 這部分是求B2:B21的最大值,SMALL(B2:B21,1)是求B2:B21的最小值。

COUNT(B2:B21)-2 意思是B2:B21的資料個數減去最大最小值2個數據。

你被平均了嗎?

圖1

公式2:=TRIMMEAN(B2:B21,2/COUNT(B2:B21))

trimmean函式功能是返回資料集的內部平均值。函式TRIMMEAN先從資料集的頭部和尾部(最高值和最低值)除去一定百分比的資料點,然後再求平均值。當希望在分析中剔除一部分資料的計算時,可以使用此函式。

函式語法TRIMMEAN(array, percent)

Array為需要進行整理並求平均值的陣列或資料區域。

Percent為計算時所要除去的資料點的比例,例如,如果Percent = 0。1,在20個數據點的集合中,就要除去 2個數據點 (20 x 0。1):頭部除去1 個,尾部除去1個,共去2個。

2/COUNT(B2:B21)=0。1,公式2表示在B2:B21中去掉頭部和尾部的資料後再求平均值。如圖2,F列公式和E列公式結果一樣。

圖2

如果只是除去最大值則公式為:=(SUM(B2:B21)-LARGE(B2:B21,1))/(COUNT(B2:B21)-1)

如果只是除去最小值則公式為:=(SUM(B2:B21)-SMALL(B2:B21,1))/(COUNT(B2:B21)-1)

當一組資料裡出現極端資料(較大或較小)時,用平均數代表整體水平,就有可能失真,只能用眾數或中位數表示;當一組資料裡的眾數(出現次數較多的資料)出現在高階或低端,用眾數表示整體水平,也不科學,所以用中位數表示更加客觀真實。

如果資料中的最大數和最小數相差不大的情況下用平均數average,

如果這組資料中的最大數和最小數相差大的情況下用中位數median,

如果這組資料中出現最多的數佔這組資料的一半或一半以上就用眾數mode。

下面我們來看看圖1的資料如果要求近20個數的中位數。

除去最大值和最小值求中位數的公式:=MEDIAN(SMALL(B3:B22,ROW($2:$19))),公式輸入完按住Ctrl+Shift+Enter,這是個陣列公式,公式意思是求B2:B21中第2小值到第19小值的中位數,即去掉最大值和最小值。公式往下拖動就可以動態的求出近20個數的中位數。

圖3

MEDIAN 函式功能是返回給定數值的中值,中值是在一組數值中居於中間的數值,如果引數集合中包含偶數個數字,函式 MEDIAN 將返回位於中間的兩個數的平均值。

今天的分享到此結束,如果想看更多歷史文章,請從選單所有文章檢視。