基礎準備
Excel數據分析工具包提供了19種數據分析工具,編者根據統計學內容,做了簡單的分類,方便大家使用,今篇介紹第一個:“描述統計”。
之前介紹(回顧:),數據分析需要先對數據信息從三個方面做初了解:集中趨勢(回顧:),離散程度(回顧:)和分布形狀(),每個方面都有各自的幾種指標:
Excel統計描述
在Excel分析工具介紹(回顧:)中已經介紹過如何調用出分析工具,這里就不在贅述。
Excel描述統計的內容也是從集中趨勢、離散程度和分布形狀來闡述數據的信息,除此之外標準差公式excel有兩個,還提供了兩項推斷統計結果和其它輔助結果:
集中趨勢
該描述統計集中趨勢的描述指標,主要有均值、中位數和眾數。數值含義和計算公式比較簡單,可以回顧:。大家可以用中介紹的公式計算出結果,再與用Excel函數計算的結果對比。
如果單獨用Excel計算,可以使用函數:
均值:();
中位數:();
眾數:mode()
離散程度
離散程度指標(回顧:)中:最大值,最小值和區域(最大值-最小值)都比較容易理解;需要重點說明的是標準差和方差,這里默認的是樣本的標準差和方差,所以分母是自由度(n-1),而不是總體標準差方差的n。大家可以用中介紹的公式計算出結果,再與用Excel函數計算的結果對比。
Excel函數:
最大值:Max();
最小值:Min();
標準差(樣本):STDEV.S();
標準差(總體):STDEV.P();
方差(樣本):VAR.S();
方差(總體):VAR.P();
分布形狀
數據分布形狀涉及到兩個指標:峰度和偏度(回顧:);這兩個指標都是與正態分布對比得到,與回顧文章中提到的SPSS一樣,Excel計算得出的峰度也是減去3后的結果,所以0是界限。峰度和偏度是數據集正態性的體現,如果數據偏離0很遠,可以斷定不是正態分布的,如果偏離不遠,可以用直方圖、正態分布概率紙和擬合優度檢驗進行進一步的檢驗。
Excel函數:
峰度:KURT();
偏度:SKEW();
推斷統計
在Excel統計描述中包含兩個推斷統計的指標:標準誤差和置信度(置信水平可調整);這兩個指標是基于假設:總體是正態總體且總體方差未知的情況,之前介紹過(回顧:),這種情況下,需要用到t分布來進行參數估計和假設檢驗,Excel描述統計結果的標準誤差和置信度就是基于以上結果計算得出:
標準誤差(又叫總體標準差)等于離散程度的標準差除以根號樣本容量。這是因為總體方差(標準差)未知,所以用樣本標準差來代替總體標準差進行估計(樣本標準差是總體標準差的優良估計,回顧:)。公式如下:
置信度:如果要求的是95%的置信水平,可以查t分布表的雙側檢驗結果(95%和自由度n-1),得到臨界t值,該值與上方標準誤差的乘積就是該結果。該結果的含義就是通過樣本數據得到的總體均值區間估計。公式如下:
Excel函數:
標準誤差:STDEV.S()*SQRT(觀測數)
置信度:T.INV.2T()*標準誤差
其它信息
歸類為其它信息的有求和、觀測數、最大(n)和最下(n)四項,求和和觀測數容易理解,不做說明。最大(n)和最小(n)的作用:假如分析者需要返回樣本數據中第4大或第5小的數據時,在相應的參數輸入格中輸入4和5,結果就會返回第四大和第五小的數據。
Excel函數:
求和:SUM();
觀測數:COUNT();
最大(n):LARGE();
最小(n):SMALL();
范例分析
上方圖片數據是編者隨機輸入的23個值,列1表格是用“Excel數據分析工具”-“描述統計”計算的結果,后面兩列分別列出每個結果對應的Excel函數和函數計算結果,方便大家對照理解。
結論
Excel數據分析工具中提供的統計描述選項能夠快速給出數據集的集中趨勢、離散程度和分布形狀等信息,這些信息使數據分析者能夠對數據集有大致理解,然后可以進行針對性的其它數據分析。
藍色字體設置超鏈接,直接點擊回顧遺忘知識!!!
有任何疑問標準差公式excel有兩個,請留言!!!