[說人話的統(tǒng)計學·協(xié)和八]第四章·上 方差分析(ANOVA)-多組平均數(shù)的比較

注:說人話的統(tǒng)計學系列原連載于協(xié)和八微信公眾號。本文為筆者的學習筆記,每篇文章標題已加入原文超鏈接。如侵權請告知。

01 要比較三組數(shù)據(jù),t檢驗還能用嗎?| 協(xié)和八

多次對同一組數(shù)據(jù)使用統(tǒng)計檢驗來否定同一個原假設,不管具體涉及的檢驗方法是什么,幾乎都會導致假陽性升高

可以使用Bonferroni 修正

對于檢驗三組或以上的數(shù)據(jù)是否具有相同的平均值,有專門的統(tǒng)計檢驗武器——方差分析(英文為 ANOVA,代表 Analysis Of Variance)

為什么對于三組或以上數(shù)據(jù)的比較,方差分析會優(yōu)于 t 檢驗?

因為 t 檢驗需要對兩兩組合進行多重檢驗,進而需要處理假陽性的問題,而方差分析只要通過一次檢驗就能驗證結論。

02 ANOVA在手,多組比較不犯愁 | 協(xié)和八

總平方和(total sum of squares)可以分為組間平方和(between-group sum of squares)和組內平方和(within-group sum of squares)
總平方和大致描繪的就是每個個體的實際數(shù)據(jù)圍繞它們共同性質所決定的理論平均值的波動程度。
組間平方和對應的是各組的平均值之間的差別,而組內平方和則是各數(shù)據(jù)點與自己所在組的平均值之間的差別。
組內平方和越小,組間平方和越大,組間差異越顯著。

03 ANOVA的基本招式你掌握了嗎?| 協(xié)和八

ANOVA 的原假設 平均值相等
備選假設 平均值不全相等

統(tǒng)計檢驗量 F等于
(組間平方和/組間自由度)/(組內平方和/組內自由度)

ANOVA 結果的時候不僅報道 p 值,也要報道自由度

ANOVA 也有與 t 檢驗非常相似的前提條件:

  • 觀察值獨立,在包子的例子里面每一個包子的必須獨立隨機抽樣
  • 每一組內數(shù)據(jù)服從正態(tài)分布
  • 組內方差相等,比如三位師傅做的包子雖然平均值未知但是方差得相等

如真的有一組或多組數(shù)據(jù)與其它組不同,ANOVA 結果會有很大概率是顯著的。統(tǒng)計功效與假陽性是一個硬幣的兩面,往往一個特定的檢驗功效高了,假陽性也會比較高,而 ANOVA 卻比較好的平衡了兩者。

ANOVA 的缺點是檢驗的結果并不明確,當你的 ANOVA 結果具有統(tǒng)計顯著性時,你并不能知道具體哪一組數(shù)據(jù)與其它組不同。為了找出具體哪一組數(shù)據(jù)不同,往往還要做事后( post-hoc )檢驗。

04 ANOVA 做出了顯著性?事兒還沒完呢!| 協(xié)和八

在ANOVA 呈現(xiàn)顯著性之后我們需要用到「事后檢驗」( post-hoc test )

組間兩兩比較用 Tukey-Kramer檢驗(又叫做 Tukey HSD)
所有實驗組與一個對照組比較用用 Dunnett 檢驗
描述來自同一正態(tài)分布的多組數(shù)據(jù)的平均值最大和最小的兩組的差距,叫做學生范圍分布( Studentized range distribution )
由組數(shù),數(shù)據(jù)樣本的大小,樣本平均方差決定


ANOVA 的統(tǒng)計功效比 Tukey-Kramer 要強,所以可能先用 ANOVA 發(fā)現(xiàn)有顯著性,但是用 Tukey-Kramer 檢驗卻發(fā)現(xiàn)所有組之間都沒有統(tǒng)計顯著性

05 聽說,成對t檢驗還有ANOVA進階版? | 協(xié)和八

重復測量 ANOVA(repeated-measures ANOVA)
是成對樣本 t 檢驗的延伸版
普通獨立樣本的 ANOVA 的邏輯,我們把數(shù)據(jù)總的變異性(總平方和)分拆為組間平方和與組內平方和,分別代表了效應和誤差。效應比誤差大得越多,那么效應就更顯著。
然而,在重復測量的情況下,「組內」(或者更準確地說是「條件內」)平方和其實有一部分并不是誤差,而是個體與個體之間本身存在的穩(wěn)定差別。

06 重復測量ANOVA:你要知道的事兒都在這里啦 | 協(xié)和八

重復測量ANOVA(repeated-measures ANOVA)。它的功能和成對樣本的 t 檢驗相似,是為了比較在同一組個體上進行多次測量(不同時間點、不同實驗條件等)后,得到的平均值是否有差異。
常規(guī)的 ANOVA 中,要得到 p 值,我們要利用組間平方和與組內平方和構建這么一個 F 統(tǒng)計量:


n 為樣本量(所有各組中數(shù)據(jù)點個數(shù)的總和),s 為組數(shù)。
重復測量 ANOVA


s 和之前一樣,為分組(實驗條件)數(shù),而 m 為不同個體的數(shù)量。

重復測量 ANOVA 的條件

  • 各分組或條件中的各數(shù)據(jù)點需要服從或近似服從正態(tài)分布,而且各個體互相獨立
  • 所有條件間來自同一個體的兩兩數(shù)據(jù)點之差的方差(variance)相等。這個假設有個專門的術語,稱為球面性(sphericity)。

怎樣才能知道球面性假設是否成立?利用 Mauchly 氏球面性檢驗(Mauchly’s Test of Sphericity),它是各大統(tǒng)計學軟件在重復測量 ANOVA 功能中的默認標配。這個檢驗的原假設是「重復測量數(shù)據(jù)具有球面性」,因此當該檢驗的 p 值小于 0.05 時,我們認為數(shù)據(jù)違背了球面性假設; p 值大于 0.05 時,我們則認為球面性得到了滿足。

如果數(shù)據(jù)不滿足球面性,那么我們需要對 F 統(tǒng)計量的自由度進行修正,最常用的修正方法是 Greenhouse-Geisser 校正(Greenhouse-Geisser correction)。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容