4.1 連續(xù)變量假設(shè)檢驗(yàn) 之 假設(shè)檢驗(yàn)簡(jiǎn)介

在總體的分布函數(shù)只知其形式,但不知其參數(shù)的情況下,或者對(duì)總體分布完全未知的情況下,為了推斷總體的某些未知特征,先提出某些關(guān)于總體的假設(shè),然后要根據(jù)樣本,采用適當(dāng)?shù)姆椒▽?duì)所提出的假設(shè)做出接受或者拒絕的決策,這一過(guò)程叫做假設(shè)檢驗(yàn)(hypothesis test)。假設(shè)檢驗(yàn)分為參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)。

我們通過(guò)簡(jiǎn)單示例來(lái)說(shuō)明概念:

某制藥公司宣稱,改公司研發(fā)的一款治療打鼾的藥,可以使患者兩周內(nèi)的治愈率為90%。某醫(yī)院醫(yī)生,在臨床觀察中抽取了15名患者發(fā)現(xiàn):兩周治療后,治愈的患者數(shù)為11,未治愈患者數(shù)為4。根據(jù)制藥公司都說(shuō)法,這15名患者中,應(yīng)該有14人治愈?,F(xiàn)在問(wèn)題來(lái)了,到底該制藥公司發(fā)布的是虛假?gòu)V告,還是醫(yī)生抽樣數(shù)據(jù)有問(wèn)題?

我們可以對(duì)制藥公司的斷言進(jìn)行檢驗(yàn):首先假設(shè)制藥公司的斷言屬實(shí),然后出這個(gè)斷言出發(fā)對(duì)現(xiàn)有的證據(jù)進(jìn)行檢驗(yàn),最后做出決策。這個(gè)過(guò)程,稱為假設(shè)檢驗(yàn)。

基本思想

假設(shè)檢驗(yàn)的基本思想是“小概率事件”原理,其統(tǒng)計(jì)推斷方法是帶有某種概率性質(zhì)的反證法。小概率思想是指小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生。反證法思想是先提出檢驗(yàn)假設(shè),再用適當(dāng)?shù)慕y(tǒng)計(jì)方法,利用小概率原理,確定假設(shè)是否成立。即為了檢驗(yàn)一個(gè)假設(shè)H0是否正確,首先假定該假設(shè)H0正確,然后根據(jù)樣本對(duì)假設(shè)H0做出接受或拒絕的決策。如果樣本觀察值導(dǎo)致了“小概率事件”發(fā)生,就應(yīng)拒絕假設(shè)H0,否則應(yīng)**接受假設(shè)H0 **。

假設(shè)檢驗(yàn)中所謂“小概率事件”,并非邏輯中的絕對(duì)矛盾,而是基于人們?cè)趯?shí)踐中廣泛采用的原則,即小概率事件在一次試驗(yàn)中是幾乎不發(fā)生的,但概率小到什么程度才能算作“小概率事件”,顯然,“小概率事件”的概率越小,否定原假設(shè)H0就越有說(shuō)服力,常記這個(gè)概率值為α(0<α<1),稱為檢驗(yàn)的顯著性水平。對(duì)于不同的問(wèn)題,檢驗(yàn)的顯著性水平α不一定相同,一般認(rèn)為,事件發(fā)生的概率小于0.1、0.050.01等,即“小概率事件” 。

假設(shè)檢驗(yàn)的步驟

一個(gè)完整的假設(shè)檢驗(yàn)過(guò)程,包括以下幾個(gè)步驟:

  • 提出假設(shè);
  • 構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并根據(jù)樣本計(jì)算統(tǒng)計(jì)量的具體數(shù)值;
  • 規(guī)定顯著性水平,建立檢驗(yàn)規(guī)則;
  • 做出判斷。

假設(shè)檢驗(yàn)的假設(shè)

從前面步驟可看出,我們首先提出兩個(gè)新假設(shè):

一種叫原假設(shè),也叫零假設(shè),用H0表示。原假設(shè)一般是統(tǒng)計(jì)者想要拒絕的假設(shè)。原假設(shè)的設(shè)置一般為:等于=、大于等于>=、小于等于<=。
另外一種叫備擇假設(shè),用H1表示。備則假設(shè)是統(tǒng)計(jì)者想要接受的假設(shè)。備擇假設(shè)的設(shè)置一般為:不等于、大于>、小于<。

在前面的示例中,原假設(shè)和備擇假設(shè)分別是:

  • 原假設(shè):藥物能夠在兩周內(nèi)治愈90%的患者,記作:H0:p=0.9
  • 備擇假設(shè):藥物在兩周內(nèi)之余患者少于90%,記作:H1:P<0.9

為什么統(tǒng)計(jì)著想要拒絕的假設(shè)放在原假設(shè)呢?因?yàn)樵僭O(shè)被拒絕出錯(cuò)的話,只能犯第I類錯(cuò)誤,而犯第I類錯(cuò)誤的概率已經(jīng)被規(guī)定的顯著性水平所控制。是不是有點(diǎn)不太明白,我們來(lái)看下一節(jié)。

假設(shè)檢驗(yàn)中兩類錯(cuò)誤

第I類錯(cuò)誤(Type I Error):又稱棄真錯(cuò)誤,當(dāng)原假設(shè)為真時(shí)拒絕原假設(shè)。犯第Ⅰ類錯(cuò)誤的概率通常記為α 。
第Ⅱ類錯(cuò)誤(type Ⅱ error): 又稱取偽錯(cuò)誤,當(dāng)原假設(shè)為假時(shí)沒(méi)有拒絕原假設(shè)。犯第Ⅱ類錯(cuò)誤的概率通常記為β。

image.png

在統(tǒng)計(jì)實(shí)踐中,進(jìn)行假設(shè)檢驗(yàn)時(shí)一般先控制第Ⅰ類錯(cuò)誤發(fā)生的概率,并確定犯第Ⅰ類錯(cuò)誤的概率最大值,稱為檢驗(yàn)的顯著性水平。在樣本容量n不變的條件下,犯兩類錯(cuò)誤的概率常常呈現(xiàn)反向的變化,要使α和β 都同時(shí)減小,除非增加樣本的容量。因此,統(tǒng)計(jì)學(xué)家奈曼與皮爾遜提出了一個(gè)原則:即在控制犯第一類錯(cuò)誤的概率情況下,盡量使犯第二類錯(cuò)誤的概率小。
在實(shí)際問(wèn)題中,我們往往把要否定的陳述作為原假設(shè),而把擬采納的陳述本身作為備擇假設(shè),只對(duì)犯第一類錯(cuò)誤的概率加以限制,而不考慮犯第二類錯(cuò)誤的概率。

顯著性水平

在統(tǒng)計(jì)假設(shè)中,這種只控制α而不考慮β的假設(shè)檢驗(yàn),稱為顯著性檢驗(yàn),α稱為顯著性水平。顯著性水平是指當(dāng)原假設(shè)實(shí)際上正確時(shí),檢驗(yàn)統(tǒng)計(jì)量落在拒絕域的概率,簡(jiǎn)單理解就是犯棄真錯(cuò)誤的概率。

顯著性水平最常用的取值是:0.05/0.01/0.001等。一般情況下,根據(jù)研究的問(wèn)題,如果犯棄針錯(cuò)誤損失大,為減少此類錯(cuò)誤,α的取值應(yīng)適當(dāng)減少。

檢驗(yàn)方式與拒絕域

檢驗(yàn)方式分為兩種:雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn),單側(cè)檢驗(yàn)包括左側(cè)檢驗(yàn)、右側(cè)檢驗(yàn)。雙側(cè)檢驗(yàn)則是包含左右側(cè)檢驗(yàn)。
拒絕域:拒絕域是由顯著性水平圍成的區(qū)域。拒絕域的功能主要用來(lái)判斷假設(shè)檢驗(yàn)是否拒絕原假設(shè)的。如果樣本觀測(cè)計(jì)算出來(lái)的檢驗(yàn)統(tǒng)計(jì)量的具體數(shù)值落在拒絕域內(nèi),就拒絕原假設(shè),否則不拒絕原假設(shè)。給定顯著性水平α后,查表就可以得到具體臨界值,將檢驗(yàn)統(tǒng)計(jì)量與臨界值進(jìn)行比較,判斷是否拒絕原假設(shè)。
雙側(cè)檢驗(yàn)拒絕域:

image.png

左側(cè)檢驗(yàn)拒絕域:

image.png

右側(cè)檢驗(yàn)拒絕域:

image.png

那么我們?nèi)绾闻袛鄻颖窘Y(jié)果是否位于拒絕域中?判斷是否位于拒絕域中,就是比較p值與α進(jìn)行比較,所以樣本結(jié)果位于拒絕域的條件是:

左尾:p < α

右尾:p < α

雙尾:p < α/2 (有待驗(yàn)證)

對(duì)于示例中的判斷,若設(shè)定顯著性水平為0.05,則若p<0.05,則拒絕H0,接受H1,反之亦然。

假設(shè)檢驗(yàn)的假設(shè)形式

對(duì)于一個(gè)總體樣本均數(shù)的假設(shè)檢驗(yàn)形式:

雙側(cè)檢驗(yàn):H0:μ=μ0,H1:μ≠μ0

左側(cè)檢驗(yàn):H0:μ>=μ0,H1:μ<μ0

右側(cè)檢驗(yàn):H0:μ<=μ0,H1:μ>μ0

判斷原則:P<α,拒絕H0

兩個(gè)總體樣本均數(shù)的假設(shè)檢驗(yàn)形式:

雙側(cè)檢驗(yàn):H0:μ1=μ2,H1:μ1≠μ2

左側(cè)檢驗(yàn):H0:μ1>=μ2,H1:μ1<μ2

右側(cè)檢驗(yàn):H0:μ1<=μ2,H1:μ1>μ2

判斷原則:P<α,拒絕H0

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容