在總體的分布函數(shù)只知其形式,但不知其參數(shù)的情況下,或者對(duì)總體分布完全未知的情況下,為了推斷總體的某些未知特征,先提出某些關(guān)于總體的假設(shè),然后要根據(jù)樣本,采用適當(dāng)?shù)姆椒▽?duì)所提出的假設(shè)做出接受或者拒絕的決策,這一過(guò)程叫做假設(shè)檢驗(yàn)(hypothesis test)。假設(shè)檢驗(yàn)分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。
我們通過(guò)簡(jiǎn)單示例來(lái)說(shuō)明概念:
某制藥公司宣稱,改公司研發(fā)的一款治療打鼾的藥,可以使患者兩周內(nèi)的治愈率為90%。某醫(yī)院醫(yī)生,在臨床觀察中抽取了15名患者發(fā)現(xiàn):兩周治療后,治愈的患者數(shù)為11,未治愈患者數(shù)為4。根據(jù)制藥公司都說(shuō)法,這15名患者中,應(yīng)該有14人治愈?,F(xiàn)在問(wèn)題來(lái)了,到底該制藥公司發(fā)布的是虛假?gòu)V告,還是醫(yī)生抽樣數(shù)據(jù)有問(wèn)題?
我們可以對(duì)制藥公司的斷言進(jìn)行檢驗(yàn):首先假設(shè)制藥公司的斷言屬實(shí),然后出這個(gè)斷言出發(fā)對(duì)現(xiàn)有的證據(jù)進(jìn)行檢驗(yàn),最后做出決策。這個(gè)過(guò)程,稱為假設(shè)檢驗(yàn)。
基本思想
假設(shè)檢驗(yàn)的基本思想是“小概率事件”原理,其統(tǒng)計(jì)推斷方法是帶有某種概率性質(zhì)的反證法。小概率思想是指小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出檢驗(yàn)假設(shè),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法,利用小概率原理,確定假設(shè)是否成立。即為了檢驗(yàn)一個(gè)假設(shè)H0是否正確,首先假定該假設(shè)H0正確,然后根據(jù)樣本對(duì)假設(shè)H0做出接受或拒絕的決策。如果樣本觀察值導(dǎo)致了“小概率事件”發(fā)生,就應(yīng)拒絕假設(shè)H0,否則應(yīng)**接受假設(shè)H0 **。
假設(shè)檢驗(yàn)中所謂“小概率事件”,并非邏輯中的絕對(duì)矛盾,而是基于人們?cè)趯?shí)踐中廣泛采用的原則,即小概率事件在一次試驗(yàn)中是幾乎不發(fā)生的,但概率小到什么程度才能算作“小概率事件”,顯然,“小概率事件”的概率越小,否定原假設(shè)H0就越有說(shuō)服力,常記這個(gè)概率值為α(0<α<1),稱為檢驗(yàn)的顯著性水平。對(duì)于不同的問(wèn)題,檢驗(yàn)的顯著性水平α不一定相同,一般認(rèn)為,事件發(fā)生的概率小于0.1、0.05或0.01等,即“小概率事件” 。
假設(shè)檢驗(yàn)的步驟
一個(gè)完整的假設(shè)檢驗(yàn)過(guò)程,包括以下幾個(gè)步驟:
- 提出假設(shè);
- 構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值;
- 規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;
- 做出判斷。
假設(shè)檢驗(yàn)的假設(shè)
從前面步驟可看出,我們首先提出兩個(gè)新假設(shè):
一種叫原假設(shè),也叫零假設(shè),用H0表示。原假設(shè)一般是統(tǒng)計(jì)者想要拒絕的假設(shè)。原假設(shè)的設(shè)置一般為:等于=、大于等于>=、小于等于<=。
另外一種叫備擇假設(shè),用H1表示。備則假設(shè)是統(tǒng)計(jì)者想要接受的假設(shè)。備擇假設(shè)的設(shè)置一般為:不等于、大于>、小于<。
在前面的示例中,原假設(shè)和備擇假設(shè)分別是:
- 原假設(shè):藥物能夠在兩周內(nèi)治愈90%的患者,記作:H0:p=0.9
- 備擇假設(shè):藥物在兩周內(nèi)之余患者少于90%,記作:H1:P<0.9
為什么統(tǒng)計(jì)著想要拒絕的假設(shè)放在原假設(shè)呢?因?yàn)樵僭O(shè)被拒絕出錯(cuò)的話,只能犯第I類錯(cuò)誤,而犯第I類錯(cuò)誤的概率已經(jīng)被規(guī)定的顯著性水平所控制。是不是有點(diǎn)不太明白,我們來(lái)看下一節(jié)。
假設(shè)檢驗(yàn)中兩類錯(cuò)誤
第I類錯(cuò)誤(Type I Error):又稱棄真錯(cuò)誤,當(dāng)原假設(shè)為真時(shí)拒絕原假設(shè)。犯第Ⅰ類錯(cuò)誤的概率通常記為α 。
第Ⅱ類錯(cuò)誤(type Ⅱ error): 又稱取偽錯(cuò)誤,當(dāng)原假設(shè)為假時(shí)沒(méi)有拒絕原假設(shè)。犯第Ⅱ類錯(cuò)誤的概率通常記為β。

在統(tǒng)計(jì)實(shí)踐中,進(jìn)行假設(shè)檢驗(yàn)時(shí)一般先控制第Ⅰ類錯(cuò)誤發(fā)生的概率,并確定犯第Ⅰ類錯(cuò)誤的概率最大值,稱為檢驗(yàn)的顯著性水平。在樣本容量n不變的條件下,犯兩類錯(cuò)誤的概率常常呈現(xiàn)反向的變化,要使α和β 都同時(shí)減小,除非增加樣本的容量。因此,統(tǒng)計(jì)學(xué)家奈曼與皮爾遜提出了一個(gè)原則:即在控制犯第一類錯(cuò)誤的概率情況下,盡量使犯第二類錯(cuò)誤的概率小。
在實(shí)際問(wèn)題中,我們往往把要否定的陳述作為原假設(shè),而把擬采納的陳述本身作為備擇假設(shè),只對(duì)犯第一類錯(cuò)誤的概率加以限制,而不考慮犯第二類錯(cuò)誤的概率。
顯著性水平
在統(tǒng)計(jì)假設(shè)中,這種只控制α而不考慮β的假設(shè)檢驗(yàn),稱為顯著性檢驗(yàn),α稱為顯著性水平。顯著性水平是指當(dāng)原假設(shè)實(shí)際上正確時(shí),檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的概率,簡(jiǎn)單理解就是犯棄真錯(cuò)誤的概率。
顯著性水平最常用的取值是:0.05/0.01/0.001等。一般情況下,根據(jù)研究的問(wèn)題,如果犯棄針錯(cuò)誤損失大,為減少此類錯(cuò)誤,α的取值應(yīng)適當(dāng)減少。
檢驗(yàn)方式與拒絕域
檢驗(yàn)方式分為兩種:雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn),單側(cè)檢驗(yàn)包括左側(cè)檢驗(yàn)、右側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)則是包含左右側(cè)檢驗(yàn)。
拒絕域:拒絕域是由顯著性水平圍成的區(qū)域。拒絕域的功能主要用來(lái)判斷假設(shè)檢驗(yàn)是否拒絕原假設(shè)的。如果樣本觀測(cè)計(jì)算出來(lái)的檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值落在拒絕域內(nèi),就拒絕原假設(shè),否則不拒絕原假設(shè)。給定顯著性水平α后,查表就可以得到具體臨界值,將檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較,判斷是否拒絕原假設(shè)。
雙側(cè)檢驗(yàn)拒絕域:
image.png
左側(cè)檢驗(yàn)拒絕域:

右側(cè)檢驗(yàn)拒絕域:

那么我們?nèi)绾闻袛鄻颖窘Y(jié)果是否位于拒絕域中?判斷是否位于拒絕域中,就是比較p值與α進(jìn)行比較,所以樣本結(jié)果位于拒絕域的條件是:
左尾:p < α
右尾:p < α
雙尾:p < α/2 (有待驗(yàn)證)
對(duì)于示例中的判斷,若設(shè)定顯著性水平為0.05,則若p<0.05,則拒絕H0,接受H1,反之亦然。
假設(shè)檢驗(yàn)的假設(shè)形式
對(duì)于一個(gè)總體樣本均數(shù)的假設(shè)檢驗(yàn)形式:
雙側(cè)檢驗(yàn):H0:μ=μ0,H1:μ≠μ0
左側(cè)檢驗(yàn):H0:μ>=μ0,H1:μ<μ0
右側(cè)檢驗(yàn):H0:μ<=μ0,H1:μ>μ0
判斷原則:P<α,拒絕H0
兩個(gè)總體樣本均數(shù)的假設(shè)檢驗(yàn)形式:
雙側(cè)檢驗(yàn):H0:μ1=μ2,H1:μ1≠μ2
左側(cè)檢驗(yàn):H0:μ1>=μ2,H1:μ1<μ2
右側(cè)檢驗(yàn):H0:μ1<=μ2,H1:μ1>μ2
判斷原則:P<α,拒絕H0
