SPSS中的數(shù)據(jù)分析—描述性統(tǒng)計(jì)分析【3】

之前跟大家介紹了關(guān)于如何利用條形圖、餅圖以及帕累托圖來(lái)進(jìn)行描述性統(tǒng)計(jì)分析,當(dāng)時(shí)有跟大家說過,這三個(gè)圖更多的時(shí)候是針對(duì)定性數(shù)據(jù)進(jìn)行圖形描述。今天我們就一起來(lái)看看針對(duì)定量數(shù)據(jù)的圖形描述—直方圖、莖葉圖以及箱圖。不知道大家在上一篇文章之后有沒有自己先去了解一下,話不多說,直接進(jìn)入到我們今天的分享。

直方圖

直方圖在展示上和條形圖十分類似,在之前的文章中也有用EXCEL給大家介紹過如何制作直方圖,不知道大家還有沒有印象。直方圖應(yīng)用于連續(xù)型數(shù)據(jù),在圖中的表現(xiàn)為直方圖的各個(gè)條形之間是沒有間隔的。它先將連續(xù)型的數(shù)據(jù)分成了若干個(gè)連續(xù)的區(qū)間,然后再計(jì)算觀測(cè)值在每個(gè)區(qū)間出現(xiàn)的概率或者相對(duì)頻率。和條形圖類似,直方圖也是以劃分的區(qū)間作為橫軸,然后每個(gè)觀測(cè)值在對(duì)應(yīng)區(qū)間出現(xiàn)的頻率作為圖形的高度,最后繪制出我們的直方圖。從直方圖可以直觀的看到數(shù)據(jù)的分布情況,例如觀測(cè)數(shù)據(jù)的分布是否對(duì)稱,是相對(duì)于偏左還是偏右,還能夠從圖中看出數(shù)據(jù)的眾數(shù)是什么。還有一點(diǎn)是直方圖還可以大致判斷數(shù)據(jù)是否服從正態(tài)分布,在以后的分析中也是會(huì)出現(xiàn)的,比如在回歸分析中就可以用到。

上圖是我們本次用來(lái)繪制直方圖所用到的數(shù)據(jù),展示的是企業(yè)22個(gè)銷售員的銷售額,我們現(xiàn)在需要繪制直方圖來(lái)對(duì)這些數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析。

直方圖的繪制區(qū)域我們?cè)谏弦黄恼轮杏谐霈F(xiàn)過,就是在我們繪制條形圖和餅圖的時(shí)候,第三個(gè)選項(xiàng)就是直方圖,如下圖:

如上圖所示,在設(shè)置完成以后點(diǎn)擊確定,就可以出現(xiàn)我們本次繪制的直方圖了,我們可以從圖中看到整體銷售員的銷售額分布情況,從而了解到目前的的銷售狀況如何。

莖葉圖

在看完直方圖以后,我們?cè)賮?lái)看看莖葉圖。莖葉圖是描述定量變量的一種圖形方式,它不僅可以展示直方圖所表述的信息,還能夠還原大部分原始數(shù)據(jù)的信息。

上圖是我們繪制莖葉圖用到的數(shù)據(jù),兩列數(shù)據(jù)分別為企業(yè)12個(gè)員工在一定時(shí)間內(nèi)的銷售件數(shù)以及對(duì)應(yīng)的占比。莖葉圖所在區(qū)域位于描述統(tǒng)計(jì)菜單的探索子菜單中:

在進(jìn)入到探索界面以后,我們將占比選入到因變量中,然后在繪制選項(xiàng)中就可以看到莖葉圖的選擇項(xiàng)。在這里需要注意的是,前一步中的輸出要選擇最后一項(xiàng)圖。最后單擊確定就可以輸出我們繪制的莖葉圖:

在上面的繪制框當(dāng)中,我們能看到左邊有一個(gè)選項(xiàng)就是箱圖,在箱圖區(qū)域可以選擇箱圖的類型、如果我們?cè)谙旅婀催x帶檢驗(yàn)的正態(tài)圖,還可以輸出選定變量的Q-Q圖、變量正態(tài)性的K-S檢驗(yàn)和S-W檢驗(yàn),通過這個(gè)我們可以來(lái)判斷變量是否服從正態(tài)分布。

關(guān)于箱圖的分析我們一會(huì)兒繼續(xù),先來(lái)看看莖葉圖應(yīng)該怎么看。莖葉圖由三部分構(gòu)成:頻率、莖和葉。在這三部分里,莖對(duì)應(yīng)觀測(cè)值最左邊一位的取值,而葉對(duì)應(yīng)最左邊第二位的取值,在葉的部分每一個(gè)數(shù)字代表一個(gè)個(gè)案。相對(duì)應(yīng)的行左邊的頻率是該行對(duì)應(yīng)的個(gè)案?jìng)€(gè)數(shù),也就是該分支中的個(gè)案的個(gè)數(shù)。

莖葉圖最后一行“Each leaf:1case(s)”代表著每一個(gè)個(gè)案對(duì)應(yīng)一個(gè)葉節(jié)點(diǎn),”Stem width:10.0”代表莖是取觀測(cè)值十位數(shù)上的值,如果觀測(cè)值小于10,則相應(yīng)的莖為0。

箱圖

箱圖是總結(jié)五數(shù)(最小值、第一個(gè)四分位數(shù)、中位數(shù)、第三個(gè)四分位數(shù)、最大值)的圖形表現(xiàn)。一般來(lái)說,箱圖在比較兩組或者兩組以上的觀測(cè)值時(shí)尤其有用,另外我們用箱圖也可以判斷離群值。

在我們繪制莖葉圖的時(shí)候,我們就可以選擇繪制箱圖,在箱圖部分,我們還可以選擇不同的箱圖類型,里面有按因子水平分組、不分組以及無(wú):

1.按因子水平分組:在探索界面,如果我們?cè)谝蜃恿斜淼牟糠衷O(shè)定了因子變量,就會(huì)為每一個(gè)因變量生成單獨(dú)的顯示。在一個(gè)顯示中,將為因子變量定義的每個(gè)組顯示箱圖。

2.不分組:在探索界面,如果我們?cè)谝蜃恿斜淼牟糠衷O(shè)定了因子變量,就會(huì)按照因子變量定義每個(gè)組生成單獨(dú)的顯示。在一個(gè)顯示中,分別為每個(gè)因變量并排顯示箱圖。當(dāng)不同的變量代表不同的時(shí)間度量的同一個(gè)特征時(shí),此顯示尤其有用,在使用中會(huì)有特別大的幫助。

3.無(wú):不輸出箱圖。

在上面做莖葉圖的繪制圖形中,我們?cè)O(shè)置輸出箱圖,就會(huì)得到如下結(jié)果:

在箱圖中,設(shè)四分位距為IQR+Q3-Q1。箱圖的箱體部分的下邊界代表第一個(gè)四分位數(shù)的位置,上邊界代表第三個(gè)四分位數(shù)的位置,中間的粗體線段代表中位數(shù)的位置,箱體的高度即為四分位距IQR。最下面的短線代表Q1-1.5IQR的位置。

如果如果觀測(cè)值落入[Q3+1.5IQR,Q3+3IQR)或者(Q1-3IQR,Q1-1.5IQR],則該觀測(cè)值為離群值,會(huì)在箱圖上用小圓圈表示出來(lái),同時(shí)會(huì)在它的旁邊顯示出這個(gè)個(gè)案的記錄號(hào)。如果觀測(cè)值大于等于Q3+3IQR或者小于等于Q1-3IQR,則該觀測(cè)值會(huì)被判定為極端值,在箱圖上用星號(hào)表示,依舊會(huì)在旁邊顯示該個(gè)案記錄號(hào)。

最后,如果只有一個(gè)因變量,莖葉圖或者箱圖將按照因子的各個(gè)水平輸出,選擇不分組的輸出結(jié)果和選擇按因子水平分組的輸出結(jié)果只是在標(biāo)題的組織方式上有一些不同。如果有兩個(gè)因變量,則兩種選項(xiàng)的結(jié)果差異較大。

到這里我們這一次的描述性統(tǒng)計(jì)分析就全部給大家分享完了,篇幅比較長(zhǎng),大家一定要好好的練習(xí)這幾個(gè)方法,因?yàn)樵诤竺娴姆治鲋袝?huì)隨時(shí)出現(xiàn)這幾種描述性統(tǒng)計(jì)分析方法。

歡迎大家進(jìn)行補(bǔ)充,大家可以在我們的QQ交流群(514581193)或者微信群中(關(guān)注小白數(shù)據(jù)營(yíng)公眾號(hào)后臺(tái)留言進(jìn)入)參與討論和交流。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容