
19年高考已經(jīng)落下帷幕,近期全國(guó)錄取線也已經(jīng)公布,估計(jì)各位靴子們陸陸續(xù)續(xù)也會(huì)收到高校寄來(lái)的錄取通知書,金榜題名,豈不快哉。
2019年高考文科數(shù)學(xué)·全國(guó)Ⅰ卷有一道題,其實(shí)特別符合實(shí)際工作中使用,就是我們題目中見(jiàn)到的卡方檢驗(yàn),題目如下:

這道題考查的是【卡方獨(dú)立性檢驗(yàn)】,其實(shí)高中那會(huì)還記得這個(gè)些,但是工作以后又忘了,不過(guò)卡方檢驗(yàn)在實(shí)際生活中還是有一席應(yīng)用之地的
檢驗(yàn)兩個(gè)分類變量之間關(guān)聯(lián)性
正確答案是這樣的

這個(gè)題的第一問(wèn)不用考慮,關(guān)鍵是第二問(wèn),它考查卡方檢驗(yàn)的原理,需要計(jì)算卡方值,不過(guò)試題中給出了卡方值計(jì)算的公式,將這些數(shù)值直接帶入公式進(jìn)行計(jì)算即可得到卡方值=4.762。
獲得卡方值對(duì)比發(fā)現(xiàn)卡方值大于3.841,
結(jié)論:有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)有顯著差異。
這道題其實(shí)是簡(jiǎn)化了卡方檢驗(yàn)的流程和步驟,我在一個(gè)公眾號(hào)上看到了比較詳細(xì)的解答方案,附在了后面,
強(qiáng)調(diào):轉(zhuǎn)載《自這道高考文科數(shù)學(xué)題你會(huì)做嗎?》原創(chuàng):?ccccfys公眾號(hào):spss統(tǒng)計(jì)分析,如有侵權(quán),請(qǐng)聯(lián)系刪除,感謝
卡方檢驗(yàn)的標(biāo)準(zhǔn)步驟
對(duì)于這個(gè)試題的第二問(wèn),這里使用假設(shè)檢驗(yàn)標(biāo)準(zhǔn)步驟來(lái)進(jìn)行解答:
第一步:提出一對(duì)假設(shè)?
H0:男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)沒(méi)有差異
H1:男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)有顯著差異
第二步:計(jì)算卡方統(tǒng)計(jì)量
得到:卡方值=4.762 。卡方值的計(jì)算可以如試題中給出的公式一樣進(jìn)行計(jì)算,還有另外一種計(jì)算方法,公式和計(jì)算過(guò)程如下:
第二種算法更加容易理解,實(shí)際頻數(shù)就是樣本數(shù)據(jù)的情況,期望頻數(shù)是指:假設(shè)H0成立時(shí),即假設(shè)男女之間滿意的概率相同時(shí)計(jì)算出來(lái)的頻數(shù),本案例中,總共有100人,有70人滿意,30人不滿意,因此期望頻數(shù):男性 滿意 = 50×0.7 = 35,50是男性總?cè)藬?shù),0.7是總體滿意的比例,其它的計(jì)算類似。最后得到的卡方值也是等于4.762。
如果上面表格中的O和E都是相等的,那么最終得到的卡方值就等于0,O和E都相等,那說(shuō)明期望的和實(shí)際一樣,也就是說(shuō)如果卡方值等于0,男女之間滿意的概率就是完全相同的。如果卡方值不等于0,卡方值越大,就說(shuō)明男女之間滿意的概率就相差越大,當(dāng)卡方值超過(guò)一定的臨界值后,就認(rèn)為男女之間滿意的概率存在顯著差異。
第三步:將計(jì)算得到卡方值與置信度為95%的卡方臨界值3.841進(jìn)行比較
如果卡方值>3.841,就要拒絕H0,接受H1;否則就要接受H0.在這個(gè)題目中,因?yàn)镵=4.762>3.841,因此要拒絕H0,接受H1,結(jié)論為:有95%的把握認(rèn)為男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)有顯著差異。
點(diǎn)評(píng):高考試題給出的答案,沒(méi)有交代這樣的步驟,顯得有些突兀。這樣的三個(gè)步驟就清楚多了,但是這其中還涉及到卡方分布、卡方值計(jì)算公式,步驟里面也沒(méi)有凸顯出來(lái),也就是說(shuō),還需要掌握卡方分布,才能真正理解這道題。我對(duì)高中教材已經(jīng)很陌生了,不知道這道題是不是超綱了,知道的朋友可以留言。
使用SPSS快速得到卡方檢驗(yàn)的結(jié)果
對(duì)于咋們這些經(jīng)歷過(guò)高考,甚至已經(jīng)大學(xué)或者研究生畢業(yè)的人而言,就沒(méi)必要再這樣用公式,用筆算的形式去解題了,我們可以直接使用統(tǒng)計(jì)軟件來(lái)解這道題。首先我們將數(shù)據(jù)錄入到SPSS中:
然后使用人數(shù)變量對(duì)數(shù)據(jù)進(jìn)行加權(quán),操作是【數(shù)據(jù)】→【個(gè)案加權(quán)】,將【人數(shù)】選入【頻率變量】,點(diǎn)擊確定。
然后進(jìn)行交叉分析,并輸出卡方檢驗(yàn)結(jié)果,操作是【分析】→【描述統(tǒng)計(jì)】→【交叉表】,然后按下圖所示選擇變量,并勾選【統(tǒng)計(jì)】里面的【卡方】,完成后點(diǎn)擊確定。
下面是SPSS的輸出結(jié)果:先給出了交叉表,然后給出了卡方檢驗(yàn)的結(jié)果,計(jì)算得到的卡方值也是4.762,在SPSS中,要根據(jù)后面的【漸進(jìn)顯著性】取值來(lái)下結(jié)論,這個(gè)值如果小于0.05,就認(rèn)為男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)有顯著差異,此處這個(gè)值是0.029小于0.05,因此可以認(rèn)為男、女顧客對(duì)該商場(chǎng)的服務(wù)評(píng)價(jià)有顯著差異。
點(diǎn)評(píng):此處給出的是假設(shè)檢驗(yàn)的第二種下結(jié)論的方法,即【用P值做決策】,高考給出的參考答案是【用統(tǒng)計(jì)量臨界值做決策】的結(jié)果。當(dāng)然兩種方法結(jié)論應(yīng)該完全是一致的。